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PROLOGO 


El presente libro, es producto de las experiencias en la enseñanza del curso de 
Bibliometria, que tiene como prerrequisito los cursos de matemática básica, 
estadística descriptiva y estadística inferencial, esperando que este material 
sirva de ayuda al estudiante y profesional de la carrera de bibliotecología y 
ciencia de la información, el cual tiene por objetivo realizar un análisis 


bibliométrico de la literatura científica. 


El libro se divide en 4 capítulos, acompañado de teoría y práctica para su mejor 


compresión. 
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Capítulo | 


Los términos bibliometría y  cienciometría fueron introducidos casi 
simultáneamente por Pritchard y por Nalimov y Mulchenko en 1969. Mientras 
que Pritchard explicó el término bibliometría como *la aplicación de métodos 
matemáticos y estadísticos a libros y otros medios de comunicación”, Nalimov y 
Mulchenko definieron la cienciometría como “la aplicación de aquellos métodos 
cuantitativos que se ocupan del análisis de la ciencia vista como un proceso de 
información”. De acuerdo con estas interpretaciones, la especialidad de la 
cienciometría se restringe a la medición de la comunicación científica, mientras 
que la bibliometría está diseñada para tratar con procesos de información más 
generales. Los límites de alguna manera difusos entre las dos especialidades 
casi se desvanecieron durante las últimas tres décadas, y hoy en día ambos 
términos se usan casi como sinónimos. En cambio, la informetría de campo tomó 
el lugar de la bibliometría especializada originalmente más amplia. El término 
informetría fue adoptado por VINITI (Gorkova, 1988) y representa un subcampo 
más general de las ciencias de la información que se ocupa del análisis 
estadístico matemático de los procesos de comunicación en la ciencia. En 
contraste con la definición original de bibliometría, la informetría también se 
ocupa de los medios electrónicos y, por lo tanto, incluye temas como el análisis 
estadístico del texto (científico) y los sistemas de hipertexto, las circulaciones de 
las bibliotecas, las medidas de información en las bibliotecas electrónicas, los 
modelos para los procesos de producción de información y los análisis 
cuantitativos. aspectos de la recuperación de información también (Glanzel, 
2003: 6) 


1.1. Bibliometria 


La palabra “bibliometría” deriva de los vocablos griegos biblos: * libro”, y metron: 
"medir. Es la aplicación de las matemáticas y el método estadístico a la publicación 
de los resultados de la investigación científica; dicho de otra manera, es la aplicación 
de tratamientos cuantitativos a la comunicación escrita, producto tangible de la 
investigación. La bibliometría parte de la necesidad de cuantificar ciertos aspectos 
de la ciencia para poder comparar, medir y objetivar la actividad científica (Dávila, 
et.al, 2009: 320). 


El análisis estadístico de la literatura científica comenzó casi 50 años antes de que 
se acuñara el término “bibliometría”. En 1926, Alfred J. Lotka publicó su estudio 
pionero sobre la distribución de frecuencias de la productividad científica 
determinada a partir de un índice decenal (1907-1916) de Chemical Abstracts. Lotka 
concluyó que 


“el número (de autores) que hacen n contribuciones es aproximadamente 1/n? de los 
que hacen una; y la proporción de todos los contribuyentes, que hace una sola 
contribución, es de alrededor del 60 por ciento.” 


Este resultado puede considerarse como una regla empírica incluso hoy, 75 años 
después de su publicación. 


Casi al mismo tiempo, en 1927, Gross y Gross publicaron su estudio basado en citas 
para ayudar a decidir qué publicaciones periódicas de química deberían comprar 
mejor las bibliotecas universitarias pequeñas. En particular, examinaron 3633 citas 
del volumen de 1926 del Journal of the American Chemical Society. Este estudio se 
considera el primer análisis de citas, aunque no es un análisis de citas en el sentido 
de la bibliometría actual. 


Ocho años después de que apareciera el artículo de Lotka, Bradford (1934) publicó 
su estudio sobre la distribución de frecuencia de artículos sobre revistas. Encontró 
que 


“si las revistas científicas se ordenan en orden de productividad decreciente sobre 
un tema dado, pueden dividirse en un núcleo de revistas más particularmente 
dedicadas al tema y varios grupos o zonas que contienen el mismo número de 
artículos que el núcleo cuando el número de publicaciones periódicas en el núcleo 
y las zonas sucesivas será como 1: b:b?...” 


Zipf (1949) formuló una ley interesante en bibliometría y lingúística cuantitativa que 
derivó del estudio de la frecuencia de palabras en un texto. Según Zipf rf = C, donde 
res el rango de una palabra, f es la frecuencia de aparición de la palabra y C es una 
constante que depende del texto analizado. Puede considerarse una generalización 
de las leyes de Lotka y Bradford. Formuló el siguiente principio subyacente de su 
ley, aunque nunca ha demostrado cómo se aplica este principio a su ecuación. 1 


"El Principio del Mínimo Esfuerzo significa... que una persona... se esforzará por 
resolver sus problemas de tal manera que minimice el trabajo total que debe realizar 
para resolver tanto sus problemas inmediatos como sus probables problemas 
futuros...”. (Zipf, 1949). (Glanzel, 2003: 6-7). 


La Bibliometría estudia el comportamiento de la producción de la literatura 
científica (libros, revistas científicas, artículos científicos, autores, etc.) y para tal 
objetivo utiliza a las matemáticas y la estadística. La Bibliometria proporciona 
información sobre cómo se desenvuelve la producción de la literatura científica 
ya sea: local, nacional, nacional e internacional, con el objetivo de tomar 
decisiones. 


1.2. Cienciometría 


Es el estudio de la Ciencia como problema multidimensional que reúne a 
investigadores + textos + conocimiento. Es decir, es la Ciencia de la Ciencia. 
(Amezquita et. al, 2011: 12). 


Mide el movimiento de la actividad social y tienen con objetos: el análisis de la 
producción, circulación y consumo, de trabajos científicos. 


1.3. Informetría 


La infometría es ampliamente utilizada para la medición de variables que 
intervienen en el análisis del contenido del quehacer investigativo, a través de la 
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implementación de modelos teóricos y medidas de información. Por ello, la las 
matemáticas y la modulación son herramientas fundamentales en el proceso de 
gestión de la información. (Amézquita et. al, 2011: 19). 


Toma en cuenta los dos conceptos anteriores y desarrolla métodos y 
procedimientos para medir y analizar los procesos de investigación científicas. 


1.4. Análisis bibliométrico 


Consiste en realizar el seguimiento de publicaciones científicas y/o autor, 
tomando como referencia la materia y el periodo de análisis con el objetivo de 
dar solución a un trabajo científico. Utilizando las bases de datos: 


e  Scopus, 

e Webof Science (WOS), 

e Google Scholar, 

. PubMed 

e MEDLINE 

e Journal Citation Reports(JCR) 

e Science Citation Index Expandel (SCI) 
e Current Contents Connect (CC). 


Diferencias entre Bibliometría, Cienciometría e Informetría 


Tipología Bibliometría Cienciometría Informetría 
Libros, documentos, | Disciplinas, materias, | Palabras, documentos y 
revistas, artículos, autores | campos y esferas. bases de datos. 

y usuarios. 

Variables Números en circulación, | Aspectos que diferencian a | Difieren de la 
citas, frecuencia de | las disciplinas y a las | cienciometría en los 
aparición las palabras, | subdisciplinas. Revistas | propósitos de las 
longitud de las oraciones. | autores, trabajos, forma en | variables, por ejemplo, 
etc que se comunican los | medir la recuperación, la 

científicos. relevancia, el recordatorio, 

etc. 
Clasificación, frecuencia, | Análisis de documento y | Modelo rector-espacio, 
distribución. correspondencia. modelos  boleanos de 
recuperación, modelos 
probabilísticos, lenguaje 
del procesamiento, 


enfoques basados en el 
conocimiento, tesauros. 
Objetivos Asignar recursos, dinero, | Identificar esferas de | Aumentar la eficiencia de 
tiempo, etc. interés; dónde se | la recuperación 
encuentran las materias; 
comprender cómo y con 
qué frecuencia se 
comunican los científicos. 
Fuente: McGrath W. (1989). What bibliometricians, scientometricians and informetricians study; 
a typology for definition and classification; topics for discusión (citado por Amezquitam, et al, 
2011: 22) 


Capítulo 2 
2.1. Conceptos matemáticos 


2.1.1 Ecuaciones exponenciales 


Se denomina así aquellas ecuaciones algebraicas, en la cual la incógnita 
aparece como exponente. 


Ejemplos 


1 2x+l 
16 
E 


gr _ gan 
3 
Xx 
xx =3 
Para resolver una ecuación exponencial nos valemos de algunas propiedades: 


a =qa >x=m 


x=b >x=b 


a x 


*x =04 >x=q 


Ejercicios resueltos 


Calcular el valor de “x 
q pon 49r +x-6 


aya = 49 +6 


3 


xx) 2 
492 =ggótes 


ra tex6 a >x=z3t 


3 
2 2 


Calcular el valor de “x 


1 
qu E 2-12 
Gr 
3 a E En 3 E E As -3(2x ES 12) 


r+3= 604363 71=33>91=5 
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Ejercicios propuestos 


En cada uno de los casos calcular el valor de "x" 


1 2x+1 
3 3)" =16 
G 
3 
4 e o 


2.1.2. Logaritmos 
El logaritmo de un número real positivo N > 0, en una base dada b>0 diferente 


de la unidad, es igual a un exponente x, exponente que debe elevarse a la base 
para reproducir el número dado. 


Log, N =x>b*=N, b>0, bx+x1 N>0 
Ejemplo-1 
Hallar el logaritmo de 64 en base 2. 
Log,64=x>2*=64>2*=2 >x=6 
Es decir 6 es el logaritmo de 64 en base 2. 
Ejemplo-2 


Hallar el logaritmo de 0.001 en base 10 


Log,,0.001=x >10" =0.001 > 10" =107 >x=-3 


Propiedades de los logaritmos 


a. El logaritmo de la unidad es igual a Cero, Log,1=0 
b. Logaritmo de la base es igual a la unidad, Log,b=1 


C. El logaritmo del producto de varios factores en una base dada, es igual a 
la suma de los logaritmos de sus factores en la base dada. 


d. Log,N.P.Q = Log,N +Log,P + Log,Q 
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e. El logaritmo del cociente de dos números en una base dada, es igual al 
logaritmo de la diferencia del numerador y denominador en la base 
dada. 


M 
f. Log, N =Log,M —Log,N 


g. El logaritmo de una potencia N' en una base dada, es igual al 
exponente multiplicado por el logaritmo del número en la base dada. 


h. Log,N” =r.Log,N 
i. Log, (a/b)=-1 
j. Elcambio de base 


El logaritmo de un número "a"en una base dada "b", es igual a un 
cociente, del logaritmo del número "a" y el logaritmo de la base "b" 


ambas en una base de interés “Cc 


Log,a 
Log b” 


C 


Log,a = c =una base cualquiera 


Regla de la cadena (del cambio de base) 

Log,a.log. b= Log,a 

Corolario de la regla de la cadena 

si a=c>Log,c.log.b=Log,c=1 

Nota 

Log,yN = Log N , cuando la base es 10 se omite la base 

Log, N =Ln N , cuando la base es el número neperiano e=2.718.... 
Teorema 


A ambos lados de una igualdad se puede aplicar logaritmo. 
y=a'* entonces log y =loga* 


Demostración 
log a* 
log y 


y=a" entonces log, a” =1> =1> log y = loga* 
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Ejercicios resueltos 


Ejemplo-1 


Hallar X en: 22 = 500 


Solución 
22" = 500 > log, 500=2x+1> cn =2x+1>8.96578=2x+1> x=3.98289 
08 
Ejemplo-2 
Despejar X en: 
1010 
¡NS 
Solución 
2y =10* -10> 


2y=10* os > 2y.10* =10* -1> (10%) -2y(10)-1=0 


Hacemos que m=10* 


m*-2ym-1=0 


2y+.4y?-4MED  2y+.4?+1 
e Z (MED _2y A y En 


m=y+t.y?+1>10* = yt. /y?+1>x=1lo0g(y+./y? +1) 
Ejemplo-3 
Linealizar el modelo no lineal 
y=ab" » 
Para linealizar el modelo no lineal, se aplica logaritmos a ambos lados 


Log y = Log ab* 
Log y = Log a+ Log b* 


Log y =Log a+ xí(Log b) 
Z = A+Bx< (modelo linealizado) 


Siendo: 


Z=Log y A=Loga B=Logb 
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Ejercicios propuestos 


1. 


10. 


11. 


Hallar Log, 64 
Hallar el valor de X en: 
192+3 Ea pa 


Linealizar el siguiente modelo no lineal 


e 


Calcular: log, 2 16 

Calcular el valor de x en cada caso: 
+ ==100 

xa e 20 

Despejar el x en cada caso: 


ga een po 


Si Log 64=a Log 81=b, hallar el logaritmo de 2 en base 3 


Hallar los valores de YX € Y 
37 =5 
3 =7 
Calcular * en la ecuación: aa =p 9" 
Hallar los valores de x e y 
aa =2 
log, (x — y) =3 
Resolver 


log,(2x+1)+l0g,(2x+1)=1 
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12. 


13. 


14. 


15. 


16. 


17. 


18. 


Resolver 

log, x+log, x+log, x=11 
Resolver 

log, 2+l08,,,8=2 
Resolver 

log, x+log, x+log¿x=11 
Resolver 

3)089 (1-8) = 2 

Resolver 

1+log(x—1) =lo0gx 
Resolver 
2log,(x+1)+log,(x—1)=2 
Resolver 


aaa a qa == —0.54908492 


2.1.3. Progresión geométrica (PG) 


Es una sucesión de números, en la cual un término cualquiera es igual al 
anterior multiplicado por una constante, a esta constante se le llama razón 
geométrica (cociente entre dos cantidades). Una PG de n términos tiene 
la siguiente forma: 


Siendo 

a =Primer término de la progresión geométrica 

r =Razón de la progresión geométrica 

ar”” = Último término de la progresión geométrica 
Nota 

Termino del lugar k de una PG 


=agr 
T, =a1 
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Suma de los términos 


_a(l—r”) 
1-7 


S 


Productos de los términos de una PG 


n(n-1) 
P=atr ? 


Convergencia de una PG cuando la razón (-1<r<1j-(0). Cuando la 
suma de sus términos tiende al infinito. 


> a 
Ss, == 
lim$S, == 


300 1 
Ejemplo-1 
Sea la progresión geométrica: 3, 3/4, 3/16, 3/48 
Calcular: la razón, suma, producto y la suma límite de sus términos. 


3/4 3/16 3/48 1 
3 3/4 3/16 4 


Razón > r 


Suma> S = a 


4 

1=0/4") _3.984375 
1 
P=E 
4 


4(4-1) 


Producto > P = VQ =0.01977539 


Suma límite de los infinitos términos —> S = 


Ejemplo-2 


Sea la sucesión de términos, supongamos que es una PG: 
5, 11, 20, 41 


Calcular la razón geométrica estimada 


11 20 41 
+ 


+ — 
1224 2.003 
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2.1.4. Gráfica de funciones 


Sea la función matemática de la línea recta 


y=3+2x 
X=variable independiente e y=variable dependiente, el valor que toma” y” 
depende del valor que se asigna a “x” 


La función proporciona pares ordenados (X, Y), para obtener estos pares 
ordenados , damos valores arbitrario a la variable X y calculamos los 
correspondiente valores para Y. 


x y 
4 11 
6 15 
8 19 
10 23 
12 27 


Los pares ordenados (X, Y), lo presentamos en un plano cartesiano (nube de 
puntos) y tiene por gráfica 


30 
y=2x2¿ 
20 
o Y 
10 ——- Lineal (Y) 


Ejercicios propuestos 
Graficar las siguientes funciones: 


_ 400 


.5 
x? 


b. y= 1.56log(2>) 
x 


c. y=1.2502*) 
20 
d. = 
a 2+3x 


e. y=+x+l 
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2.2. Conceptos estadísticos 

2.2.1. Media geométrica (%g) 

Se utiliza cuando los datos por su naturaleza, presentan un comportamiento de 
una serie en progresión geométrica o los datos provienen de una variación 
porcentual. 

La fórmula: 

Sea un conjunto de A datos positivos, tal que x, >0 


e A OS 


Su valor corresponde a la raíz n —enésima del producto de los A datos 


Xg= dl 
También se puede expresar por: 


Log(Xe) = Log(W/X¡.X,.Xz....X, )= 15 Log(x,) > 
Mal 


Xe = antig 7 Log(x,) 


i=1 
Ejemplo-1. 
Calcular la media geométrica para los siguientes datos: 


4, 9, 15, 32 


Xg = /(41015)G2) = 17280 =11.465 
La media geométrica para los datos es de 11.5 
También, por el otro método 


log(4) + log(9) + log(15) + log(25) 
4 


Log(xs)= =1.059385935 


Xe = 110 1:059385935 =1 1.465 


Ejemplo-2. 


La información de la tabla corresponde a la producción de artículos científicos en 
medicina entre los años 1990 al 2020 de cierto país. Calcular la producción 
promedio anual y el incremento anual promedio. 
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Variación=se 
Producción de Avda la 
Años revistas científicas producció mas 
en medicina cla 

cualquiera por 

el año anterior 
1990 120 
1995 150 1.25 
2000 187 1.246667 
2005 234 1.251337 
2010 293 1.252137 
2015 366 1.249147 
2020 458 1.251366 


Calcular la producción promedio de revistas científicas 


xs =/(1201150)...(458) = 234.23 articulos 


Calcular la variación promedio de la producción de revistas científicas 


xg =$/(1.25)(1.246667)...(1.251366) =1.25 
La variación promedio es de 1.25 (125%) y su incremento promedio cada 5 años 
es de 1.25-1=0.25 en porcentaje=25%. 


2.2.2. Media armónica (xa) 


Se utiliza cuando con cierta cantidad fija, se generan otras cantidades con dos 
unidades: km/hora, monto/articulo, horas/artículos, etc. y se pide calcular el 
promedio es esta última. 

La fórmula es: 


Sea un conjunto de MA datos positivos (no cero) 


0 e O 


Ejemplo: 


Se tiene 80 nuevos soles y se desea comprar cierto número de revistas 
científicas de la misma materia y en tres editoriales, tal como se presenta en la 
tabla. Calcular el precio promedio de las revistas. 
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Revistas Cantidad Precio unitario por 
científicas revistas=monto/cantidad 
A 5 S/.16=x1 
B 8 S/.10=x2 
Cc 10 S/.8=x3 
Xa = Ss =5S/.10.43 
A A 
16 10 8 


S/.10.43, es el precio promedio de las revistas. 


2.2.3. Hipótesis estadística 


Es un supuesto que se hace en la poblacion en estudio, con respecto a la 
distribución de una variable aleatoria o a sus parámetros, la validez de este 
supuesto, será confrontado con una muestra elegida al azar de la poblacion, un 
estadístico de prueba y un nivel de significación, que elige el investigador para 
rechazar o no la hipótesis que se supone cierta en la poblacion (hipótesis nula). 
Se supone que este supuesto lo hace el investigador con la experiencia en el 
campo de su competencia. Una hipótesis se representa con la letra mayúscula 
H. 


Ejemplos 


1. La distribución del número de artículos por revistas científica en matemática 
sigue una distribución normal. 


H :La variable número de artículos por revista científica sigue una distribución 
normal. 


2. El promedio del número de artículos por revista científica, en matemática es 


16 artículos. 
H:u=16 Artículos 


3. La variabilidad del número de artículos por revistas con respecto a la media 
en la poblacion es de 23.5 artículos?. 


H:0?*=23.5 articulos? 


La Hipótesis estadística puede ser nula (llamada también planteada) 
simbolizada por 4, o H, y la hipótesis alternante simbolizada por 4H, o H.. 


Hipótesis Nula o Planteada (HH, ) 


Es la hipótesis estadística, sobre la cual el investigador está dispuesto a creer a 
priori como verdadera, y cuya validez será sometida a comprobación a través de 
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una muestra elegida al azar de la poblacion en estudio. La hipótesis nula se 
formula con el objetivo de ser rechazada, pero con una probabilidad bien 
pequeña (0.1, 0.05, 0.01), en caso de obtener una muestra desafortunada (es 
decir con valores muy altos o valores muy bajos). 


Hipótesis Alternante (A, .) 


Es la contraparte de la hipótesis nula y representa la creencia o sospecha que el 
investigador quiere probar. 


Ejemplo 


Un bibliotecólogo afirma que el número promedio de artículos por revistas 
científicas es 14 artículos, esta afirmación corresponde a la hipótesis nula; la 
hipótesis alternante podría ser diferente a 14 artículos, mayor a 14 artículos o 
menor a 14 artículos: 
H,:u=14 articulos 
H,:4%14, H,:4>14, HB, :u<l4 


TIPOS DE ERRORES 


La decisión de rechazar o no rechazar la hipótesis nula, con base a la 
información de la muestra aleatoria extraída de la población en estudio, pude 
conllevar a decisiones erradas debido a las fluctuaciones del muestreo, y 
cometer los siguientes errores. 

ERROR TIPO | 


Consiste en rechazar la hipótesis nula A, a consecuencia de los datos de la 
muestra cuando esta es cierta en la población. 


ERROR TIPO || 


Consiste en no rechazar la hipótesis nula A, a consecuencia de los datos de 
la muestra cuando esta es falsa en la población. 


Para estos dos tipos de errores se presenta el siguiente cuadro 


CUADRO 
DECISION POBLACION EN ESTUDIO 
TOMADA DEBIDO 
A LA MUESTRA H, ES CIERTA H, ES FALSA 
H, SEACEPTA | DECISION CORRECTA ERROR TIPO |l 
H, SE RECHAZA ERROR TIPO | DECISION CORRECTA 
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Nivel de significación de la prueba (X 


Es probabilidad de cometer el error tipio |, se denota con el símbolo (Y, es una 
medida de la confiabilidad de la decisión de rechazar la hipótesis nula. Las 
probabilidades utilizadas para rechazar la hipótesis nula H, para 


a=1%, 5%, 10% 


0 


a: = P(cometer el error tipo 1) = P(rechazar H, / H, es cierta) 


Nivel de significación P 


Es la probabilidad de cometer el error tipio Il, se le denota con el símbolo £ 
$B = P(cometer el error tipo II) = P(aceptar H, / H, es falsa) 


Potencia de la prueba (-2) 


Es la probabilidad de aceptar la hipótesis alternante dado que esta es verdad 
1- P =P(acepta H, / H, es cierta) 


Supuestos para una prueba estadística 


Para realizar una prueba de hipótesis para determinados parámetros de una 
poblacion en estudio se requiere el cumplimiento de un conjunto de supuestos, 
para dar validez a la decisión que se toma: 


a. Los datos de la muestra son elegidos al azar de la poblacion en estudio. 

b. La variable de donde proviene el parámetro tiene una distribución normal. 

Cc. Existe pruebas de ciertos parámetros, que requiere que el tamaño de la 
muestra debe ser grande. 


Prueba de hipótesis 


Para evaluar una prueba de hipótesis sobre determinados parámetros, se utiliza 
la distribución muestral de la variable aleatoria de donde proviene el parámetro, 
datos de una muestra elegida al azar de tamaño n y el nivel de significación a 
para rechazar la hipótesis nula 77, . 


Del ejemplo anterior, supongamos la siguiente hipótesis nula y alternante: 


H,:p=14 articulos 
H,:ux14- articulos 


Suponiendo que el parámetro a evaluar proviene de una distribución normal con 


variancia igual a 12.25 articulos? y el nivel de la significación a =0.05 , bajo la 
hipótesis nula cierta. Planteamos: 
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P(rechazar H,/H, verdadera en la poblacion) = 0% 


Plx<a U x>b)=0.05 


Pl x-14 a A l x-14 e 
412.25/4/n  /12.25/W4/n 412.25/4/n 4112.25 //n 
a—-14 b-14 
0 RE e E o A 
412.25 //n 412.25 //n 


a—-14 --196 a—-14 Ml 
412.25 //n 112.25 //n 
412.25 aio 412.25 

n /n 


Para un tamaño de muestra n=50. Se tiene: 


1.96 


a =14-1.96 


412.25 4112.25 
4/50 4/50 


a =13.03 b=14.97 


a =14-1.96 


A los valores 13.03 y 14.97 se le conoce como valores críticos, si la muestra 
elegida al azar de tamaño 50 arroja que la media muéstral es de 12 o 16, 
entonces se rechaza la hipótesis nula con un nivel de significación del 5%, y se 
concluye que hay suficiente evidencia muestral para rechazar la hipótesis nula 
con una significación del 5%. Si el valor de la media muéstral se encuentra entre 
los dos valores críticos, entonces no se rechaza la hipótesis nula con un nivel de 
significación del 5%. Gráficamente se tiene: 


13.03 14.0 14.97 
Las áreas a la izquierda y derecha de los puntos 13.03 y 14.97, se le llama zona 


de rechazo de la hipótesis nula y la zona entre los puntos 13.03 y 14.97 se le 
llama zona de no rechazo de la hipótesis nula. 


Región critica o de rechazo de H, 


Es la región que contienen los valores muestrales para lo cual se rechaza la 
hipótesis nula (x<13.03 o x>14.97) 
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Región aceptación de HH, 


Es la región que contienen los valores muestrales para lo cual no se rechaza la 
hipótesis nula (13.03 < x < 14.97) 


En lo sucesivo el procedimiento anterior se puede simplifican estandarizando el 
valor obtenido en la muestra y comparando con el valor tabular obtenido del nivel 
de significación. 


Resumiendo: La prueba es la siguiente 


H,:um=14 articulos 


H,:ux+14- articulos 
Supongamos que para un tamaño de muestra n=50, el valor de la media 


muestral es x=15.2 y la variancia de la población se conoce o? =12.25 y el nivel 
de significación para la prueba es a =0.05. Entonces se estandariza el valor 
obtenido para la muestra que es un valor Z, y se compara con la región crítica 
determinada por el nivel de significación de la distribución Z. si el valor 
estandarizado cae en la zona de rechazo, entonces se rechaza la hipótesis nula 
de lo contrario no se rechaza la hipótesis nula. A la fórmula que me permite 
estandarizar el valor muestral y tomar la decisión de rechazar o no rechazar la 
hipótesis nula, se le llama estadístico de prueba. 


15.2-14 
Z. = === 2.424366 
412.25 
150 
Gráfica de distribución 
Normal; Media=0; Desv.Est.=1 

0.4 

0.3 
Me] 
2 

502 
la] 

0.1 

0.025 0.025 
0.0 
-1.960 0 1.960 


El valor Zc = 2.424366, cae en la zona de rechazo la hipotesis nula, luego se 


rechaza la hipotesis nula. 
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Nota: 
Otra forma de rechazar o no rechazar la hipótesis nula HA, , es comparar el nivel 


de significación y establecido para la prueba, con la probabilidad de rechazar la 
hipótesis nula proporcionado por el estadístico de prueba calculado, valor de 
probabilidad que se conoce con el nombre del p valor. Del ejemplo anterior. 


a=p>se rechaza la H, 


a<p>se no se rechaza la H, 


La hipótesis nula HA, se rechaza si: 


He 152-14 ,, > 15214, Ple 15214, pz 7152-14, 
: 412.25 “4112.25 j 112.25 “2 412.25 
/50 /50 /50 /50 


P(z, <-2.424366) + P(z, > 2.424366) = 0.007668 + 0.007668 =0.015336 = 0.015 
como 0=0.05>p=0.015>se rechaza la H, 


Pasos a seguir para probar una hipótesis estadística 


a. Plantear la hipótesis nula y alternante en términos del enunciado del 
problema 

b. Elegir el nivel de significación para la prueba. 

Cc. Región critica (Región de rechazo de la hipótesis planteada Ho) 

d. Cálculos del estadístico de prueba, usando los datos de la muestra y bajo 
el supuesto de la hipótesis nula cierta. 

e. Decisión y conclusión. 


Pruebas de hipótesis para la media de una población 


Sea una población en estudio, en la cual se define una variable aleatoria de 
interés X', supongamos que la variable tiene una distribución normal con media 
. ' 2 A Se . 
M y variancia O”, de dicha población se toma una muestra aleatoria 
X¡»X>»»..X,, obteniéndose la media muestral X. Se demuestra que los 


estadísticos: 


Ss A 0) 


“ olWn 


Se usará cuando la variancia de la población se conoce. 


(¿= EE 
en” abel 
s/n (Dg 
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Se usará cuando la variancia de la población no se conoce y el tamaño de la 
muestra es menor a 30, para un tamaño de muestra mayor a 30, se puede usar 
la distribución Z. 


Formulación de las hipótesis: 


Pruebas bilaterales Pruebas unilaterales 
H,:4=5, H,:424, H,:42 A, 
. H S . 
HA, : HA A, a: HSA, H,:H<na, 
Ejemplo-1 


Probar con un nivel de significación del 5% que la media del número de artículos 
de cierta revista científica es superior a 15 artículos. Una muestra de 21 revistas 
elegidas al azar de la poblacion, arroja que la media muestral es de 17 artículos 
con una varianza de 46.24 artículos?. 


H,:p<ls5 
H,:u>15 


Nivel de significación para la prueba  «a=0.05 = P(rechazar H,/H.,, cierta) 


Región critica para la prueba, como la prueba de hipótesis es unilateral a la 
derecha (por la hipótesis alternante) la región critica o de rechazo de la hipótesis 
planteada es: 


Gráfica de distribución 
T; df=20 


0.4 
0.3 


0.2 


Densidad 


0.1 


0 1.725 


Estadístico de prueba: como la variancia de la población no se conoce y el 
tamaño de la muestra es menor a 30, el estadístico de prueba para este caso es: 
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y —* Mo 


-t(n-Dgl/H, Cierta 


: s/n 
Te - 17715 1348 
6.8/4/21 


T. =1.348 < T0.052072 =1.725 , entonces no se rechaza la hipótesis nula, por lo 


tanto no existe la suficiente evidencia estadística para rechazar la hipótesis nula 
de que la media poblacional del número de artículos es menor a 15 artículos. 


Ejemplo-2 


De la pregunta anterior, para que valores del estimador Y se rechaza la 
hipótesis nula. 


Se rechaza la hipótesis planteada siempre y cuando: 


ramos 20151705 41519356 


E s/n Jn 


Se rechaza la hipótesis nula para valores de la media muestral superior a 17.56. 


Prueba de hipótesis para una proporción poblacional 


só O A ie A 
Sea la proporción muestral p=“=, siendo "x" el número de elementos con la 
n 


cualitativa de interés en la muestra y "n" el tamaño de la muestra, si 


n>0w (n>30), entonces Z¿= dación N(0;1) , corresponde al estadístico de 
P 
prueba. 
Siendo: 
o? = Pp) Si el muestreo es con reemplazo 
n 
o5= PEA Non Si el muestreo es sin reemplazo 
n N-1 
Ejemplo-1: 


Los datos que a continuación se presenta corresponden a una muestra aleatoria 
de la cantidad de artículos publicados por cierta revistas científica en ciencias 
matemáticas. 
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13 15 13 12 20 23 10 12 
19 24 23 12 14 15 17 13 
18 12 13 14 12 17 18 12 
14 19 16 25 25 11 13 14 
17 21 18 23 15 16 15 15 


¿Probar con un nivel de significación del 5% que la proporción de revistas con 
más de 15 artículos publicados es superior al 42%? 


Hipótesis a probarse 


H,:P<0.42 
H,:P>0.42 


1. Nivel de significación de la prueba 
a=0.05=P(rechazar la H,/H,, cierta, en la población) 


2. Estadístico de prueba 


3. Supuestos: 


a. Las observaciones son elegidas aleatoriamente 
b.  Eltamaño de muestra es grande 


4. Criterio de decisión 


Gráfica de distribución 
Normal; Media=0; Desv.Est.=1 


0.4 


0.3 


0.2 


Densidad 


0.1 


0.0 
1.645 


xo 


Se acepta H, ,si Z,<1.645 , en caso contrario se rechaza. 


Cálculos, de los datos se tiene: 
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Tamaño de la muestra Numero de revistas con 
más de 15 artículos 
40 18 


Con n,=40 p, ==045, se tiene que la 


a paa Ñ peo AER 
za n 40 
Z.= 0.45 0.42 _ 0.3844 
0.078038 
Conclusión 


Como  Z.=0.3844<1.645; luego no se rechaza la hipótesis planteada y se 
concluye, para a=0.05 evidencias muéstrales indican que la proporción de 


revistas con más de 15 artículos no es superior a 0.42. 


Como para todas estas pruebas se utiliza es estadístico Z, se presenta la 
siguiente tabla para valores clásicos del nivel de significación: 


Hipótesis alternante Nivel de significación de la prueba 
0.01 (1%) 0.05 (5%) 0.1 (10%) 
2 colas -2.576 y 2.576 -1.96 y 1.96 -1.645 y 1.645 
1 cola a la derecha 2.326 1.645 1.282 
1 cola a la izquierda -2.326 -1.645 -1.282 


Ejercicios propuestos: 


Probar con un nivel de significación del 5% que la edad promedio de los 
usuarios que concurren a un centro de información es diferente a los 27 
años. Una muestra de 50 usuarios elegidos al azar, proporciona la 
siguiente información: 


50 50 
Ya =1604. 55290 
b. =l ¡=l 


Probar con un nivel de significación del 5% que el número promedio de 
artículos por revistas en computación es superior a 8 artículos. Una 
muestra de 15 revistas elegidas al azar de una población con distribución 
normal en cuanto al número de artículos proporciona los siguientes datos: 
10 8 9 15 17 7 12 14 16 9 
8 10 15 12 7 


. Probar con un nivel de significación del 5% que el número promedio de 
artículos por revistas en computación es diferente a 18 artículos. Una 
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muestra de 50 revistas elegidas al azar proporciona la siguiente 
información. 


e. Probar con un nivel de significación del 5% que la proporción de revista 
científicas en idioma inglés es diferente de 0.24. Una muestra de 100 
revistas elegidas al azar proporciona la siguiente información de que 28 
están en idioma inglés. 


f. Probar con un nivel de significación del 5% que el número promedio de 
personas que ingresan a un centro de información durante el día de 
atención es diferente a 630, se eligen al azar una muestra de 50 días y se 
obtiene por media aritmética 590 personas y desviación estándar 236 
personas. 


g. Probar con un nivel de significación del 5% que la proporción de revista 
científicas en idioma inglés es superior a 0.35. Una muestra de 200 
revistas elegidas al azar proporciona la siguiente información de que 80 
están en idioma inglés. 


h. En una biblioteca desconocemos la proporción de libros escritos en 
español. De una muestra aleatoria de 125 libros, 80 de ellos están escritos 
en español, y el resto en otros idiomas. Según estos datos, ¿se puede 
afirmar que la proporción de libros escritos en español en dicha biblioteca 
es mayor a 0.67. Use un nivel de significación de 0.05. 


i. Probar con un nivel de significación del 5% que la proporción de revistas 
científicas en idioma inglés en la poblacion es superior a 0.38. De una 
muestra elegida al azar de 150 revistas, se encuentra que 60 están en 
idioma inglés. Calcular el valor calculado y la decisión tomada. 


j. Probar con un nivel de significación del 5% que la proporción de revistas 
científica en física escrita en idioma inglés es superior a 0.45. Una muestra 
de tamaño 300 elegida al azar de la poblacion de revistas científica en 
física, arroja que 165 son revistas en idioma inglés. 


2.2.4. Medidas de asociación. 


Coeficiente de correlación lineal simple de Pearson 


El coeficiente de correlación lineal simple mide la fuerza o grado de asociación 
lineal entre dos variables cuantitativas XA e Y , que poseen una distribución 
normal bivariada. Su valor varía entre [-1, 1], un valor próximo a 1 o -1 indica 


una alta asociación lineal entre la variable, el valor positivo indica una asociación 
lineal directa y un valor negativo indica una asociación lineal inversa, un valor 
cercano a cero indica que las variables no están asociadas linealmente. 


Supuestos 
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e Las variables X e Y son aleatorias 
e Las variables X e Y tienen distribuciones normales bivariada 
e Existe una relación lineal entre las variables X e Y 


Para calcular este coeficiente, se toma una muestra aleatoria de tamaño *n” de 
datos bivariados (x,,),), correspondiente a las variables X e Y; luego un 
estimador para el parámetro p llamado, el coeficiente de correlación lineal 
poblacional es dado por: 


Y (x, -D0, y) Y xy, == =— 
i=1 


Eo Eo» O OS 
i=1 i=1 Y y 


¡=l n ¡=l 


¡0 


r= 


El valor que toma este coeficiente varía en el intervalo —1<r<-+1 


1. r =+l nos indica que existe una asociación o correlación lineal perfecta 
positiva; es decir si “X” aumenta “Y” también aumenta; en otras palabras, 
todos los puntos están sobre una línea recta de pendiente positiva. 

2. r=-1, hos indica que existe una asociación o correlación lineal perfecta 
negativa; es decir si “X” aumenta “Y” disminuye y viceversa; en otras 
palabras, todos los puntos están sobre una línea recta de pendiente 
negativa. 

3. r =0, nos indica que no existe relación lineal entre las variables Y e y; 


esto no implica que las variables x e y sean independientes. 
Ejemplo 


La información de la tabla corresponde a la producción de artículos científicos 
sobre enfermedades del corazón, durante los años 1990 al 2020 


X=Años Y=Producción de artículos 
científicos 
1990 22 
1995 30 
2000 42 
2005 55 
2010 62 
2015 70 
2020 82 


¿La producción de artículos científico está asociado linealmente al tiempo? 


Para el cálculo del coeficiente de correlación lineal, se tiene las siguientes 
sumatorias que aparecen en negrita en la siguiente tabla. 
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X Y XY Xx? y? 
1990 22 43780 3960100 484 
1995 30 59850 3980025 900 
2000 42 84000 4000000 1764 
2005 55 110275 4020025 3025 
2010 62 124620 4040100 3844 
2015 70 141050 4060225 4900 
2020 82 165640 4080400 6724 
14035 363 729215 28140875 21641 

Aplicando la formula (1) 
729215 (14035)363) de 
= 0.99700332 


Interpretación: 0.997, este valor indica que los años y la producción de artículos 
científicos sobre la enfermedad del corazón están altamente asociados en forma 


A =— 70042816.857143 
qpa1a0s7s 04085 ¡7161 E 100 


directa. 


El valor del coeficiente de correlación lineal, por sí solo no es suficiente para 
evaluar el grado de asociación existente entre dichas variables. Este valor es 
resultado de una muestra elegida al azar de una poblacion, para dar validez a 
este coeficiente es necesario establecer una hipótesis con respecto a su 
parámetro y poder juzgar la asociación poblacional de las variables X e Y con la 


Prueba de hipótesis para el coeficiente de correlación lineal 


evidencia muestral y un nivel de significación « . 


1. 


Cuando el valor hipotético del coeficiente de correlación población 


(parámetro) es cero p=0 


Cuando se desea verificar si el coeficiente de correlación estimado es o 
no nulo, lo cual sugiere la existencia o no de una asociación significativa 
entre las variables en estudio Y e Y, se tienen las siguientes hipótesis: 


H,:p =0 > (No hay correlacion lineal entre X e Y) 
H,:p%0> (hay correlacion lineal entre X e Y) 


Nivel de significación a = P(rechazar H, /H ,,es cierta) 


El estadístico de prueba es: 


Se rechaza la hipótesis nula, para una prueba de dos colas. 


Si 1, <T o e 


a 
Gra) Ga 
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NOTA 


Sino se rechaza Ho entonces nos indica que las evidencias muéstrales expresan 
que no existe una correlación lineal significativa entre las variables X e Y. Pero 


debe tenerse presente que el no rechazo de Ho no implica que las variables X e 
Y sean independientes. 


También al rechazar la Ho, indicará que las evidencias muéstrales expresan que 
existe una correlación lineal significativa entre las variables X e Y. Debe tenerse 


presente que el rechazo de Ho no implica que la relación funcional entre las 
variables en estudio sea necesariamente una función lineal. En estos casos es 
recomendable obtener una grafico de la dispersión de los datos, para estudiar el 
tipo de relación funcional entre las variables. 


Ejemplo 


Del ejemplo anterior, probar con un nivel de significación del 5% que el 
coeficiente de correlación lineal es diferente de cero 


Probar si existe una correlación lineal significativa entre las variables X e Y . 
Use a=0.05 


H,:p=0> (No hay correlacion lineal entre X e Y) 
H,:p*+0> (hay correlacion lineal entre X e Y) 
o. =0.05 


Usando la formula dada en (1) se tiene que 7 = 0.997 


Calculo del estadístico de prueba 
r=p 0.9970 


Región critica para la prueba: como la prueba es bilateral se tiene, se rechaza 
la hipótesis planteada si: 


Gráfica de distribución 
T; df=5 


0.4 
0.3 


0.2 


Densidad 


0.1 


0.025 0.025 
SN] 0 205 


0.0 
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Como 1. = 28.80 > 2.776 , entonces se rechaza la Ho. Las variables X' e Y 
están significativamente asociadas al nivel 5%. 


Ejercicio propuesto 


La siguiente tabla tiene información sobre el número de artículos publicados en 
matemáticas y el número de citas recibidas durante los años 1994 a 2000. 


ños 
1994 1995 1996 1997 1998 1999 2000 
Descripción 
N? artículos 
publicados 20 25 30 40 47 56 70 
N? citas recibidas 4 9 20 14 21 23 28 


1. Hallar el coeficiente de correlación. 
2. Probar si existe una correlación significativa entre las variables X e Y. Use 


a=0.05. 


Coeficiente de correlación de rangos de Spearman 


Su valor mide la asociación entre dos variables Y e Y ,se usa cuando por lo 
menos unas de las variables son ordinal, y no requiere que se cumpla el 
supuesto de normalidad bivariada, tiene por formula: 


6 Y (Rx, Ry, Y 


(ds — n(n? —1) (1 


(Rx, — Ry,) =Diferencias de los rangos de las variables X e Y 


Para una muestra de tamaño n, se tiene (x,,y,), los valores que toman las 
variables X e Y , se consideran los órdenes se sus valores en forman 


ascendente o descendente, a estos ordenes se le llama rangos, en caso de que 
existan empates entre sus órdenes, se toma en cuenta su valor promedio. 


La interpretación que del valor de r,, es la misma que la del coeficiente de 
correlación de Pearson. 


La fórmula anterior se usa cuando no hay empates en los rangos (ordenes), de 
lo contrario se usa la fórmula más general. 


RADAR, Ry 
dl i=l i=l 
' NA 


(2) 
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g 
A E(E)-1 
2 2 mMnó-1) 2 (Er =D) 
NR ==—-M, M == 
a 12 12 
g 
2 
n nn —1) ELE, -1) 
SR ===—-M, M == 
: 12 . 12 


M, =Es el término de corrección por empates en los rangos de x 
M, =Es el termino de corrección por empates en los rangos de y 


Supongamos que no hay empates en ambas variables la formula (2) se 


convierte en (1) 


Ejemplo 


Dos jurados evalúan a 12 candidatos para un puesto de trabajo, la calificación 


es de 0 a 20. Los datos se presentan en la tabla. 


Postulante | X=Jurado | Y=Jurado | Rx, Ry, (Rx, —Ry,) | (Rx, -Ry,y 
A B 

1 12(1) 14(1) 15 (25 E] 1 

2 14(4) 14(2) 4 25 1.5 2.25 

3 15(6) 14(3) 6 2.5 3.5 12.25 

4 13(3) 15(5) 3 6 -3 9 

5 17(9) 16(8) 95 85 1 1 

6 17(10)  [|18(12) 95  |12 25 6.25 

7 16(8) 15(6) 8 6 2 4 

8 15(5) 17(10)  |6 10.5 |-45 20.25 

9 1912) —[17(11) 12 105 [115 2.25 

10 18(11) | 15(7) 11 6 5 25 

11 15(7) 16(9) 6 8.5 -2.5 6.25 

12 12(2) 14(4) 15 [25 E 1 
total 90.5 


Aplicando la formula (2), calculamos los términos de corrección para x e y 
Para el rango de x: existe un grupo con 2 empates (g=1); otro grupo con 2 
empates (g=2) y un tercer grupo con 3 empates (g=3). 
Para el rango de y: existe un grupo con 4 empates (g=1); otro grupo con 3 


empates (g=2), un tercer grupo con 2 empates (g=3) y un cuarto grupo con 2 


empates (g=4). 


3 
Y EE; -1) 2 2 2 
Mon _2(2*-1)+2(2" -1)+363-1) 36 =s 
d 12 12 12 
4 
E(E?-1 
ME 2 LE, Y 4(4? -1)+3(3? -1)+2(2? -1)+2(2? -1) 96 
Ñ 12 12 12 
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2 
AS o E 


e sl 
12 


Existe una baja asociación entre ambas calificaciones de los jurados 


, 140+135-90.5 
*  2./140./135 


Entre las variables X e Y existe una baja correlación o asociación. 


=0.671020 


Usando la formula (1) 


y 6005) 

Ñ n(n? —1) 12(12? —1) 
Entre los valores que toma la variable X e Y existe una baja correlación o 
asociación entre las opiniones de los jurados.. 

La correlación de Pearson entre los rangos es igual a 0.671020. 


=0.683566 (m) 


Graficas de las variables X e Y 


Y=Jurado B 

20 
E TO TAM 

15 + 

10 

5 

0 y T T 1 
0 5 10 15 20 


Prueba de hipótesis 


H,:p=0>(No hay correlacion entre X e Y) 
H,:p*0> (hay correlacion entre X e Y) 


Nivel de significación a = P(rechazar H, / H,,es cierta) 


Se rechaza la hipótesis nula si el valor tabular cumple cualquiera de las 
siguientes condiciones: 
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Gráfica de distribución 


T; df=10 
0.4 
0.3 
oz 
A 
0.1 
0.025 0.025 
0.0 
-2.228 0 2.228 
*x 
El estadístico de prueba es: 
rin-=2 
L. == To-28 
1- y? 
pe r,4n=2  0.671020412-2 _ 2.862 


o afi=r?  f1-0.671020* 


Conclusión se rechaza la hipótesis nula, existe una correlación significativa 
directa entre las variables. 


2.2.5. Regresion lineal múltiple y simple 


Regresion lineal múltiple 


Estudia la relación funcional entre una variable Y, llamada dependiente o 
respuesta y un conjunto de k variables llamadas independientes (explicativas 
o predictoras), X,,X, ,..., X, de tal forma que la primera depende de la segunda 


o dicho de otra forma X,,X, ,.... X, influye en el comportamiento de Y; con el 
objetivo de: 


e Determinar las variables o factores que influyen en la variable respuesta. 
e Modelar la variable respuesta y las variables independientes 
e Predecir o estimar la media de Y, conociendo un valor de X. 


Modelo de regresion lineal múltiple con k variables independientes 


Y, =B) BA +PB A) HB AX + €, (0) 
Y =Variable aleatoria 


XX)... A, =Variables no aleatorias que influyen en el comportamiento de la 
variable Y 
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BP,» B,.».... B, =Coeficientes asociados a las variables independientes 


e,=Error aleatorio, se espera de poca influencia en Y, con media cero y varianza 
homogénea. 


De (1) por el supuesto del error aleatorio 


ETYIX, XX) =P APA AP AS AH ¿BA (Q) 
(2) en (1) 

Y =EU/X Xp. X )+€, 6) 

Una función f(X,,X,,..., X,) estima a E(Y,/X,,X,,..., X,) 


Regresion lineal simple 


Para una sola variable independiente 
Y, =P, +PX+e€, 


La media de la variable respuesta tomando en cuenta el supuesto de los errores 
aleatorios 


EY/X)=Pp, + PX 

Un modelo estimado para E(Y/ X), es dado por Y = by +b,X 

Ejemplo (1) 

Y = gastos de las familias(S/.) X= ingresos de los Jefes de familias(S/.) 


Para estas dos variables, los gastos de las familias dependen de los ingresos, 
matemáticamente. Una muestra elegida al azar de 11 familias. 


N?. Ingresos | gastos 
1 2000 1900 
2 2500 2500 
3 3000 3100 
4 3500 3700 
5 4000 3800 
6 4500 4600 
7 5000 4500 
8 5500 5000 
9 6000 4500 
10 6500 5000 
11 7000 6500 


38 


Gráfica de línea ajustada 
gastos = 786.4 + 0.7364 Ingresos 


7000 S 433.158 
e. R-cuad. 89.8% 

R-cuad. (ajustado) 88.7% 

6000 


5000 


gastos 


4000 


3000 


2000 9 


2000 3000 4000 5000 6000 7000 
Ingresos 


Una estimación para E(Y/X), es dado por:: Y = f(X) =b, +b,X 
Supuestos para un modelo de regresión lineal simple 
a. Los valores que toma X son fijados por el investigador. 


b. Para cada valor de X, fijo, se genera una población de valores para Y que 
tienen una distribución Normal con media y variancia, dada por: 


Y=N( B,+BX,; 0) 


C. Para cada población, la diferencia entre un valor cualquiera y y su media 


E(Y / x,) sele llama error, es decir: 
y, EY /x,)=€, 
y, =E(Y/x)+e€, 


Si suponemos para la media E(Y/x,) es una recta lineal; es decir que una 
recta pase por todos los puntos de la media, luego: 


FG) =E/x,)= Po + P,x, 


Lo anterior es llamado la Ecuación de Regresión Lineal Poblacional de Y sobre 
XxX 


Luego: 
Y, =P, +P Xx, +€, (1) 


(1) Se le llama la ecuación de regresión lineal poblacional o modelo de regresión 
lineal poblacional. 
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Los errores €, se distribuyen normal e independientemente como media cero 


(0) y variancia (0? ) 


ECUACION DE REGRESION ESTIMADA 


ea» 


Para estimar el modelo (1) se extrae una muestra aleatoria de tamaño 'n” y se 
registra los valores de los pares ordenados 


¡EPA AE AA 


Con estos pares ordenados planteamos la función de regresión lineal muestral 
dada por (2), la que estima a la función de regresión poblacional; es decir: 


y, =by +b,x, +e, (2) 
La recta estimada es: 
P=b,+b,x (3) 
(3) estima a la E(Y / X), es decir: 
) > EY/x) 
Para estimar los coeficientes de la ecuación de regresión muestral dado por (2), 
se hará uso de la Técnica de los Mínimos Cuadros Ordinarios (MCO), técnica 


que consiste en calcular los valores de b, y b, tal que minimice la suma 
de los cuadrados de los errores; es decir de (2), se tiene: 


ys = 2,0, =b, bx)" = f(0,,b,) 
i=l i=1 


Para obtener los valores que minimiza la función f(b,,b,) derivamos 


parcialmente con respecto a b, y d% e igualamos a cero; es decir: 


Of (b,.b 7 E 
E DO > d=)-bx 
! P OLEO $) 
NM E ) Es NÓ 
A ss OA A n 
1 n y n 
Ob, EE = xy , (aj 
¡al a tl 
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2.2.6. Coeficiente de Determinación 


Es un valor y mide la proporción o porcentaje de la variación de la variable Y 
explicada o atribuible al modelo estimado. Se calcula aplicando la siguiente 
formula. 


Ny” DIN (x, xy 
R==2 *100% = —= *100% 

Y O, -y Y (y, - y) 

T=1 I=1 


Su valor varía de 0 al 100%, cuando esta próximo al 100%, indica que la 
ecuación de la recta estimada, se ajusta o se acomoda lo mejor posible a la 
nube de puntos. 


Para una regresion lineal simple, el coeficiente de determinación se calcula a 


través del coeficiente de correlación de Pearson, elevando su valor al 
cuadrado, es decir, 


: R? si EN 100% 
Ejemplo 
Con la finalidad de estudiar la relación funcional entre la cantidad de docentes y 


la cantidad de artículos científicos publicados para 11 universidades elegidas al 
azar de cierto país, la tabla siguiente presenta la siguiente información. 


Y=N" de 
X=N* de artículos 
docentes publicados 
200 20 
300 30 
700 70 
1200 100 
1500 150 
600 50 
154 10 
136 10 
160 18 
240 36 
500 45 


a. Presentar los datos de ambas variables en un plano cartesiano (nube de 
puntos). 

b. Estimar la ecuación de regresión lineal de y sobre x. 

Calcular el coeficiente de determinación para la ecuación estimada. 

Estimar la cantidad de artículos para una universidad que tienen 1000 

docentes. 


en 


.Para la pregunta (a), se presenta la nube de puntos (X, Y) 
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800 


1000 


1200 


1400 1600 


De la nube de puntos, para las universidades en estudio existe una tendencia 
lineal positiva entre la Y=cantidad de docentes y la X=cantidad de artículos 


publicados. 


Para la pregunta (b) 


Para calcular los coeficientes de la recta estimada se debe calcular las 
siguiente sumatorias, resultados que aparecen en la última fila de la tabla 


él: 7 vá 

Y x, =5690 y y,=539 Y x,y, =473920 Dx? =5045412 

e i=1 i=l i=l 

Y y, =45045 

i=l 

Xx y x*y x*x y*y 

200 20 4000 40000 400 
300 30 9000 90000 900 
700 70 49000 490000 4900 
1200 100 120000 1440000 10000 
1500 150 225000 2250000 22500 
600 50 30000 360000 2500 
154 10 1540 23716 100 
136 10 1360 18496 100 
160 18 2880 25600 324 
240 36 8640 57600 1296 
500 45 22500 250000 2025 
5690 539 473920 5045412 45045 
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Usando la formula se tiene: 


E 000») 473000 — 66901539) 
n Es 


b, = = 0.09281537 


1 


(5690)? 


eS ¿2 5045412 — 
n 


b, =y-b,x= = 00928153750) =0.989140 


Luego la recta de regresión estimada de y sobre x es: 
Y>=b,+b,x =0.98913812+0.09281537x 


Interpretación de la pendiente 


Por cada docente que se incrementa en las universidades, la cantidad artículos 
publicado se incrementa 0.093 en promedio, si el incremento es 20 docentes el 
incremento es de 1.86 artículos publicados en promedio. 


Calculo del coeficiente de determinación 


Aplicando la formula, el valor del coeficiente de determinación es de 97.18%, 
este valor indica que, el 97.18% de la variación de los valores que toma Y 
(cantidad de artículos publicados), se atribuye a la variación de los valores que 
toma la variable (cantidad de docentes). 


Y la estimación de la cantidad promedio de artículos publicado para 1000 
docentes es de 93.8, este valor se obtiene al reemplazar en la ecuación estimada 
el valor de X=1000. 


Ejercicios propuestos. 
1. La información de la tabla corresponde a la cantidad de artículos 


publicados en química, durante los años 1990 hasta 2020. Estimar el 
modelo lineal. 


y=cantidad de 
x=años artículos publicados 
1990 13 
1995 28 
2000 42 
2005 58 
2010 17 
2015 90 
2020 110 
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2.2.7. 


Con la información de la pregunta 1. Calcular e interpretar el coeficiente 
de determinación. 

Con la información de la pregunta 1. Estimar la cantidad de artículos 
publicados para el año 2022. 


Regresión lineal simple con datos codificados para la variable X 


Ocurre situaciones en la cual los valores que toma la variable independiente X 
están igualmente espaciados, cuando esto acurre los cálculos se simplifican para 
obtener el valor del intercepto y la pendiente de la recta de regresión estimada. 
Para logar estos objetivos los datos de la variable X deben estar codificados. 


Metodología para codificar los valores que toma_X 


a. 


b. 


Se calcula el valor de — (n-—1)/2 


Al valor calculado en el punto (a) se le multiplica por el espaciado "»" 
obteniéndose: —r(n—1)/2, convirtiéndose en el primer valor codificado 


Los restantes valores codificados se obtienen sumándole al valor obtenido 
en el punto (b) el valor del espaciado "7" . 


”n 

Con los valores codificado se verifica que pa =0 , con este resultado 
i=l 

se simplifican los cálculos del intercepto y pendiente. 

Nota 


Otra forma de obtener lo mismo es utilizar la siguiente relación: 


sti r(n—1) O 
: 2 2 2 2 

E $3 ye > 2 

r = espacido 

i¡=i-—esima observacion 

n=tamaño de la muestra 


tambien se cumple que: 


S (xr x) IN 2i+1) de O 5 n? n+n]=0 
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Ejemplo 


La información que se presenta en la tabla, corresponde a la producción 


de artículos científicos en biológicas durante los años 1990 al 2015. 


a. Estimar la ecuación de regresión lineal de Y sobre X 
b. Calcular el coeficiente de correlación lineal de x e y 


Cc. Calcular el coeficiente de determinación del modelo 


X=años Y=producción 
1990 15 
1995 38 
2000 54 
2005 76 
2010 92 
2015 115 


d. Estimar la producción de artículos para el años 2017. 


e. Obtener a partir de la ecuación de regresión codificada, la ecuación de 
regresión para datos sin codificar. 


Regresión parar datos sin codificar 


Xx y x.y y? y? 
1990 15 29850 | 3960100 225 
1995 38 75810 | 3980025 | 1444 
2000 54 108000 4000000 | 2916 
2005 76 152380 | 4020025 | 5776 
2010 92 184920 | 4040100 | 8464 
2015 115 231725 | 4060225 | 13225 
12015 390 782685 (24060475 32050 


Cálculos: 


b =3.90857143 
a =-—7761.91429 
r =0.99877964 


R? =99.756 


y =-—T761.91429 + 3.90857143(2017) =121.6742843 =121.67 


Codificando los datos 


Solución (a): 


45 


Los valores de la variable x están igualmente espaciado, luego 


(6D 95 > 52.5) =-12.5 


2 
Xx =años y =Producción 

-12.5 15 

-7.5 38 

-2.5 54 

25 76 

7.5 92 

12.5 115 


Calculamos las sumas de las variables y su producto cruzado 


N? x y x.y (y y? 
1 -12.5 15 -187.5 156.25 225 
2 -7.5 38 -285 56.25 1444 
3 -2.5 54 -135 6.25 2916 
4 2.5 76 190 6.25 5776 
5 75 92 690 56.25 8464 
6 12.5 115 1437.5 156.25 13225 
Total 0 390 1710 437.5 32050 
Cálculos: 
y 
X.Y 
b=E DO 00857 
Ya? 437.5 
tal 
Y 
y 
POE 
6 6 


La ecuación de regresión lineal codificada es: 
y =65+3.90857 x' 


Solución (b): 


Calculo del coeficiente de correlación lineal de x e y 


SY x.y 1710 1710 


r= = 
? == 2 1712.089367 
His E 2375. 320502 


= 0.99878 


Solución (c): 


Coeficiente de determinación 
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R? =y? (100%) = (0.99878)* (100%) = 99.756% 

Solución (d): 

Para la proyección se debe codificar año 2017 a través de la relación 

x' =x-x>x, =2017 -2002.5=14.5 

y =65+3.90857 x' > y =65+3.90857 (14.5) =121.67 

Solución (e): 

Reemplazamos en la ecuación de regresión lineal codificada el valor de 
Y =x-x>x =x-2002.5 

Luego: 

y =65+3.90857(x -2002.5) > y =-7761.911425 +3.90857 x 


Este último resultado, también se obtiene si utilizamos los datos originales. 
Ejercicios propuestos 


1. La información que a continuación se presenta corresponden a la 
producción de artículos científicos en química entre los años 1990 a 2020. 


X=Años Y=Producción de artículos 
científicos 
1990 22 
1995 30 
2000 42 
2005 55 
2010 62 
2015 70 
2020 82 


Estimar la ecuación de regresión lineal de Y sobre X codificada. 
Calcular el coeficiente de correlación lineal 


Calcular el coeficiente de determinación 


2o.0 5 p 


Estimar la producción de revistas científicas para el año 2013 (utilizar 2 
decimales). 
e. Estimar la producción de revistas para el año 2022 (utilizar 2 
decimales). 


f. Estimarla producción de revistas para el año 2025(utilizar 2 decimales). 
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2.2.8. Regresion no lineal 


Sea la información de la tabla 


X=años | Y=producción 
1990 40 
1995 60 
2000 90 
2005 135 
2010 203 
2015 320 
2020 600 


Gráfica de la información de la tabla 


Y=Producción 
700 
600 4 
500 
400 
300 e 
200 EA 
100 + me 
. 4 
0 Ú——R——————A A AÁAÁAÁÉíáyÍy¡y]¡]_](] € á]ÁKÉKááí—TEAAÁAÁÁAAÁAÁAEAAÁAÁAÁAÁAÁAÁA AAA 
1985 1990 1995 2000 2005 2010 2015 2020 2025 


La nube de puntos de la gráfica, nos indica una tendencia no lineal y para 
modelar este comportamiento, se busca un modelo matemático que mejor se 
ajuste a la nube de puntos. 


Modelo no lineal 


y=a.b' 


Aplicando logaritmo decimal a ambos lado de la igualdad con el objetivo de 
linealizar el modelo no lineal y transformarlo en un modelo lineal, modelo que 
permite calcular los valores de a y b. 

y =ab* > log y =loga.b* > log y =loga +logb* 

log y = loga+x(logb) > log y =loga + (logb)x 

Z =A+Bx—>modelo lineal 
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Dónde: 


Z =1l0g y 
A=loga>a=10* 
B=logb>b=10* 


Sus ecuaciones para calcular A y B, suponiendo la variable X codificada, son: 


. 5 de . a pa Y 
Estima la ecuación de regresion no lineal de la forma Y = ab 


El modelo no lineal: y =141.5134851 (1.091719056 ye 


Estimar la producción de revistas científicas para el año 2022. 
Codificando el valor X=2022 


X*=X-media de los valores X 


X*=2022-2005=17años 


Ya =141.5134851(1.091719056)” 


Sea el modelo de regresión no lineal 


Y, El Bob" €; 


Haciendo la transformación con el objeto de llevarlo a un modelo lineal. 


log Y, = log fB,-B, €, = log P, + x, log f, +loge, 
2,=B, +B,x,+€, como Ele,)=0 


Una estimación para E(Z/X) = fi; + fx, es dado por 


Z=fi+fX =A+BX 
z=A+Bx modelo linealizado >z=1logy A=1lo0gf, B=1l0g f, 
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Ejemplo 


Sea la información de la tabla 


Y=producción 

id de artículos 
X=años cia 
científicos en 
matemática 

1990 5 
1995 10 
2000 20 
2005 40 
2010 80 
2015 160 


Estimar la ecuación de regresión no lineal y = ab* 

Calcular el coeficiente de correlación lineal de x e y 

Calcular el coeficiente de determinación del modelo 

Proyectar la producción de artículos científicos para el año 2017 y 2020 
Obtener a partir de la ecuación de regresión codificada, la ecuación de 
regresión para datos sin codificar 


DOQoOT Op 


Como los datos de la variable x están igualmente espaciados, entonces se 
trabaja con datos codificados: 


E y z =l0g y zx (y z 
-12.5 5 0.69897 -8.73712505 156.25 0.48855907 
-7.5 10 1 -7.5 56.25 1 
-2.5 20 1.30103 -3.25257499 6.25 1.69267905 

2.5 40 1.60205999 4.00514998 6.25 2.56659622 

7.5 80 1.90308999 14.2731749 56.25 3.6217515 
125 160 2.20411998 27.5514998 156.25 4.8581449 

[0) 315 8.70926996 26.3401246 437.5 14.2277307 
Solución (a): 
Xx,Z _26.3401246 
pol =0.060206 > 0.060206 =logb > b =1.148698 
a 437.5 
z _8. 8.709270 
4-2 - =1.451545 >1.451545 =loga > a = 28.284272 


El modelo codificado es: 


y =28.28424272 (1.148698)" 


Solución (b): 


Calculo del coeficiente de correlación entre x, e z 
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2-2 Ñ 26.3401246 _ 26.3401246 _ 
375 27 26.3401244 
ED oro 4873, 142271307 6226267 


C 


Solución (c): 


Coeficiente de determinación 
R? =r?(100%) = (1.0) (100%) =100% 


Solución (d): 


Para la proyección se debe codificar año 2017 a través de la relación 
x' =x-x>x, =2017 -2002.5 =14.5 


y= 28.284272(1.148698)" > y = 28.284272(1.148698)'** =211.12 


Para la proyección se debe codificar año 2020 a través de la relación 
xXx" =x—-x>x, =2020-2002.5=17.5 


y= 28.284272(1.148698)" > y = 28.284272(1.148698)'”* =320 


Solución (e): 


Reemplazamos en la ecuación de regresión codificada el valor de 
xi =x=x>x =x-2002.5 (3) 


(1) en (1) 


y = 28.284272(1.148698)" > y = 28.284272(1.148698)225 


Ejemplos propuestos 


1. Los datos que a continuación se presenta, corresponden a la producción 
de artículos científicos en matemáticas para los años 1980 al 2005. 


Y=producción 
de artículos 
X= años científicos en 
matemática 
1980 20 
1985 38 
1990 60 
1995 82 
2000 100 
2005 122 
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a. Estimar el modelo de regresión lineal de Y sobre X 

b. Calcular el coeficiente de correlación lineal de X e Y, interpretar 

Cc. Calcular el coeficiente de determinación, interpretar 

d. Estimar la producción promedio del número de artículos científicos para 
los años 1992 y 2003 

e. Proyectar la producción promedio para el año 2016 


2. La información que a continuación se presenta, corresponden a la producción 
de artículos científicos científicas en matemáticas para los años 1980 al 2005. 


Y=producción 
de artículos 
X= años científicos en 
matemática 
(1980-2005) 
1980 20 
1985 38 
1990 80 
1995 164 
2000 320 
2005 642 


a. Estimar el modelo de regresión no lineal de Y sobre X ( Y = ab”) 
b. Calcular el coeficiente de correlación de X e Y, interpretar 

Cc. Calcular el coeficiente de determinación, interpretar 

d. Estimar la producción promedio para los años 1992 y 2003 


e. Proyectar la producción promedio para los años 2015 y 2016 


3. Sean los datos de la tabla, estimar el modelo de regresion no lineal y = = : 
a IX 

Xx Y 

2 0.75 
4 0.43 
6 0.30 
8 0.23 
10 | 0.18 


0] 


4. Con los datos de la pregunta 3, estimar el valor de *y” para x=5 
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5. Estimar la ecuación de Lotka y =£, para los datos que se presenta a 
Xx 


continuación. 


Y=N? 
X=N? Autores 
Artículos que 
publicados | publican 
1 950 
2 174 
3 64 
4 32 
5 18 
6 12 
7 8 
8 6 
9 4 
10 3 
11 3 
12 2 
13 2 
14 1 
15 1 
16 1 


a. Con la información de la pregunta 5. Calcular el coeficiente de 
determinación. 

b. Con la información de la pregunta 5. Calcular la elite de autores más 
productivos e interpretar. 


C. Calcular el índice de productividad de autores. 


Capítulo 3 


3.1. Leyes bibliometricas 


Estudia el comportamiento estadísticamente regular de la producción y el 
consumo de la literatura científica, de una determinada materia y en un periodo 
de tiempo determinado. 


A través de la ley bibliometricas, se busca un modelo matemático que mejor se 
ajuste a la nube de puntos, de tal forma que se pueda modelar y realizar 
predicciones. 


3.2 Ley de Price (ley del crecimiento exponencial de la literatura científica) 


Derek J. de solla Price (1956), constato que el crecimiento de la literatura 
científica se produce a un ritmo muy superior respecto a otros fenómenos 
sociales, pero muy similar a otros fenómenos observables en contextos 
naturales, como los procesos biológicos. Dicho crecimiento de la literatura 
científica de una determinada materia, es tal que cada 10 a 15 años la literatura 
científica existente se duplica con un crecimiento exponencial, aunque esto 
depende en gran medida del área de conocimiento de la que se trate. 


Cada materia de estudio tiene una evolución natural, pasando por diversas 
etapas: 


e Precursores: corresponde a las primeras publicaciones de la materia en 
estudio. 


e Crecimiento exponencial: la materia de estudio por su necesidad requiere 
ser investigado a profundidad. 


e Elcrecimiento lineal: se hace lento la producción de las publicaciones. 


e Saturación: ya no existe más producción, “porque la materia ya es 


conocida. 
Gráfica 
0,45 
¿en? 
¿9035 
€É > ap 
e? 92 
+ 
0,15 
NN 7 SCI: REI 
> , 
a ye? 0,05 
l genes? == 
-3,5 3 -2,5 -2 -1,5 -1 -0,5 0 0,5 
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Para el curso se analiza la parte que tienen un crecimiento exponencial, a través 
de un modelo no lineal de la forma: 


Modelo Matemático: 


Dónde: 


Y= producción de la literatura científica (revistas, artículos, autores, etc.) de un 
tema específico y durante un período de tiempo. 

X=años 

e=base de logaritmos neperianos=2.718281828... 


Gráfica: 
y=produccion 
700 
O 640 
600 
500 
400 
300 0 320 
200 
O 160 
100 e 80 
O 40 
0 e 20 
1920 1930 1940 1950 1960 1970 1980 1990 


Para estimar el modelo, se dispone de una serie cronológica X=años y Y 
=producción de literatura científica de una materia determinada y en un período 
de tiempo. 


(rr la) 


Para estimar el modelo exponencial de Price, se linealiza aplicando logaritmos 
neperianos ambos lados de la ecuación. 


bx 


y=a.e” >modelo no lineal 
In y =Inae”" 
Iny=Ina+Ine”" 
In y =Ina+bx(Ine) 
In y =Ina+bx 
Z=A+Bx>modelo lineal 
pl 

27 
dae 

n 


Ina > a=e* =exp(4) 
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In y =Ina.e” =Ina+In.e” =1na+bx(Ine) 
In y =Ina+bx 

z=A+Bx ,siendo: 

z=lny, A=lna, B=b 


Luego las ecuaciones para B y A son: 


(2,003) 
yu- LAZO 


Si los valores x son codificados, entonces $ =( las ecuaciones se 
simplifican, quedando: 


B= E =p 
e 


A=Ina >a=e* =exp(4) 


Luego se calcula el coeficiente de determinación, para conocer la bondad de 
ajuste del modelo estimado. Para el modelo codificado: 


BY ay 


n 


R?= (100%) 


o R?=(r—Pearson con datos codificados) 


Ejemplo-1 


La producción de artículos científicos de cierta materia, durante los años 1930 
al 1980, se presenta en el siguiente cuadro 


Y=producción — 2 
X =años de ico X. Z años | 2 In y X¿.Z X, 
científicos codificado 
1930 20 -25 Ln20 -25.Ln20 625 
1940 40 -15 Ln40 -15.Ln40 225 
1950 80 -5 Ln80 -5.Ln80 25 
1960 160 5 Ln160 5.Ln160 25 
1970 320 15 Ln320 15.Ln320 225 
1980 640 25 Ln640 25.Ln640 625 
Total 0 28.37160 121.30075 1750 
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bx 
Estimar la parte exponencial del modelo de Price y =ae 


p=2%2 12130075 o 06931472=5 


NX 1750 


— 28.37160 


ÁA=z = 4.72860022 > a=e* 282 2 113.137085 


y=113.137085.g0931:24 
Calculo del coeficiente de determinación: 


Pocarson E 1 > R? = y => 1 *100% = 100% 


El valor del coeficiente de determinación indica un ajuste perfecto del modelo 
hacia la nube de puntos. 


Estimar la producción de artículos científicos para los años 1975 y 1990. 


Para utilizar el modelo estimado codificado, se debe codificar los años 1975 y 
1990. 


X¡=X-X , M=1955 
Para el año 1975 


Xíors =1975—1955=20 


y =113.137085 e 0514200 = 452,55 


La proyección para 1990, entonces x, =35 


y=113.137085.2"**** 2113,137085,8 243 1280 


De otra forma para el año 1990: 


z=4.7286+0.06931x, 

z=4.7286+0.0693 (x —x) 

z=4.7286+0.06931(1990-1955) 

z=7.15445> z=1n y=7.15445 > y=e”'**% =1279.788 =1280 
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Calculo del tiempo de duplicación de la producción de literatura científica para 
el modelo exponencial 


D 


_In2_0.69314718 


b 


0.06931 


10 año 


Ss 


El tiempo de duplicación de la producción de la literatura científica es cada 10 


años. 


Indica que cada 10 años en promedio la producción científica se duplica. 


Calculo de la tasa de incremento anual (T) 


T=100%(e” -1) =100%(e"%%' -1) =7.176% 


Anualmente la producción de la literatura científica crece en promedio en un 


7.176%. 


Ejemplo-2 


La producción de revista científica de cierta materia, durante los años 1930 al 
1980, se presenta en la siguiente cuadro 


Y=producción * — * *,2 

Xx de cos x= LE In y Xx .Z (x) 

=años científicos. años 
codificado 

1960 20 -30 2.99573227 -89.8719682 900 
1970 30 -20 3.40119738 -68.0239476 400 
1980 83 -10 4.41884061 -44.1884061 100 
1990 155 0 5.04342512 0 0 
2000 325 10 5.78382518 57.83825182 100 
2010 650 20 6.47697236 129.5394473 400 
2020 1270 30 7.14677218 214.4031654 900 
13930 2533 0 35.2667651 199.6965425 2800 


Calculo del modelo de Price 


y= 154.1782346* ¿071320194 x 


Calculo de coeficiente de determinación 


R? =99.55% 


Buen ajuste del modelo a la nube de puntos 


Predecir la producción de la literatura científica para los años 2022 y 2025 


Calculo de la media de los años, la media de los años es 1990 
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Af Años Producción estimada(reemplazando el 
Xx codificados respectivo año codificado al modelo 
XxX estimado) 
2022 32 1510.7 
2025 35 1871.2 


Calculo del tiempo de duplicación de la producción científica 


In 2 In 2 


= =9.7 años 
b 0.071320194 


Calculo de la tasa de incremento anual 


R=100%(e” —1) =100%(e" 29% —1) =7,39% 


Ley de Price: obsolescencia (envejecimiento) de la producción de la literatura 
científica 


Price, observa sobre la rapidez con la que la literatura científica de un tema dado 
pierde vigencia. Cuanto más tiempo tenga un recurso científico menos se cita 
(mención en los trabajos científicos).No es uniforme para todas las disciplina. 


Tabla 
Nro. De Cantidad del 
artículos Número de número de os a 
y : ; p Índice de Price= es el 
Años | publicados | Referencias referencia de : 
Z cociente entre (B/A) 
de un tema (B) los 5 años 
dado anteriores(B) 
2000 300 900 1996,1997,1998 | (600/900)100%=66.7% 
,1999,2000 Un índice de Price 
igual 600 superior a 30% indica 


que los artículos serán 
obsoletos rápidamente 
2001 200 400 2001,2000,1999 | (50/400)100%=12.5% 

,1998,1997=50 


Índice de Price 


Cantidad de referencia para los años (t-5+1) (100%) 
= 0 
total de referencia hasta el año t 


año t 


Grafica 


Del comportamiento de la producción científica para una determinada materia 
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0 


0 7 


1985 1990 1995 2000 2005 2010 2015 2020 2025 


4 
l ; 4 + + 2 


3.3 Ley de Lotka (1926) 


Ley de la productividad de los autores 


Enunciado 


Lotka observo que para una determinada materia de estudio y en un determinado 


periodo de tiempo, 


lo siguiente: Muchos autores publican pocos artículos 


científicos y pocos autores publican gran cantidad de artículos científicos. La ley 
de Lotka relaciona la cantidad de artículos científicos publicados (X) con la 
cantidad de autores (Y). 


Ejemplo 


Supongamos, que un período de 5 años, se ha publicado 78 artículos científicos 
sobre física para un total de 665 investigadores. 


Tabla: Cantidad de artículos publicados y 


Cantidad de autores investigadores 


X=cantidad de Y= cantidad de autores 
artículos científicos investigadores 
1 500 
2 88 
3 32 
4 16 
5 9 
6 7 
q 4 
8 3 
9 2 
10 2 
11 1 
12 1 
78 665 
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Interpretación de la tabla 

Un grupo de 500 investigadores durante los 5 años, publicaron 1 solo trabajo 
científico, 88 publicaron 2 y un solo autor en ese mismo período de estudio 
publico 12 trabajos científico. 


Gráfica 


y=N? autores 
600 


500 


400 


300 


Modelo no lineal de Lotka 


Dónde: 


Y= cantidad de autores (investigadores) 
X=cantidad de artículos publicados 


Para estimar los valores de a y b del modelo de Lotka, se toma una muestra 
de tamaño n y se registran los valores de (X, Y). Como el modelo de Lotka es 
no lineal, para calcular los valores de a y b, se linealiza aplicando logaritmos 
decimales a ambos miembros de la igualdad. 


ya log y = log (—) = loga—log x” > log y = log a — blog x 
x x 


log y = log a + (-b) log x > 
Z=A+BW >modelo lineal (2) 
donde:Z=lo0ogy W=logx A=loga B=-b 


De (2) se calculan A y B: 
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OMTED 


=-b>b=-B 


Y WZ- 
B= n 
y QA 


n 


A ze ud 
n n 


)=lo0ga > a=10* 


Gráfica del modelo linealizado de Lotka 


a 


y=>5 linealizando z=A+Bw 
de 


z=log(y) 


y = -2.4934x + 2.7064 
R2=0.9962————— 


0 0,2 0,4 0,6 0,8 1 1,2 


Calculo del coeficiente de correlación de Pearson 


Se calcula en el modelo transformado (2) 


AMO 


n 


a A 
A Qw)Y ñ 20) 
2 al * 2 ¡al 


" yz 


n 


r= 


lía al n 


Sir tiende a -1, los datos de w y z están asociados linealmente en forma inversa, 
esta asociación lineal con los datos transformados, también se transmite a las 
variables x e y. 


Sir tiende a O los datos de z y w no están asociados linealmente, esta asociación 
lineal, también se transmite a las variables x e y. 


Calculo del coeficiente de determinación 


2 . . 
R? =(coefciente de correlacion de  pearson= ry 
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Elite de autores más productivos 


Elite de autores es la cantidad de autores que publican más trabajos. Se calcula 
a través de la raíz cuadrada del total de autores. 


E = total de autores en el periodo de estudio 


Para calcular la cantidad de trabajos publicados por los autores más productivos, 
se obtiene el acumulado de autores, del más productivo hasta el menos 
productivo. 


Índice de productividad de autores (IP) 


El índice de Lotka, permite identificar a los autores con baja, mediana y alta 
productividad, a través de la siguiente relación: 


IP=0 autores con baja productividad 
IP=log(x)=w=x0<IP<1 autores con mediana productividad 


IP>1 autores con alta productividad 


Ejemplo aplicativo-1 


Los datos que a continuación se presentan corresponden a 526 autores que 
durante de 10 han publicado artículos, sobre una determinada materia. La 
primera fila de la tabla significa que se encontró a 400 autores que solo 
publicaron durante el periodo de estudio un solo artículo, y en la última fila a un 
solo autor que público 10 artículos durante el periodo de estudio. 


x= N* de artículos 
y = N* de autores 


x=N? artículos | y=N* autores 
1 400 
2 70 
3 26 
4 12 
5 7 
6 4 
7 3 
8 2 
9 1 
10 1 


Gráfica: artículos publicados versus autores 
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y=N? autores 


a. Estimar la ecuación de Lotka 
b. Calcular el coeficiente de determinación 


Cc. Calcular la elite de autores más productivo 


Para calcular la ecuación de Lotka de debe realizar los siguientes 
cálculos: 
x y 
Artículos | Autores | W=logx | z=1l0g y WZ w z? 
1 400 0 2.60205999 0 0 6.7707162 
2 70 0.30103 1.84509804 | 0.55542985 | 0.09061906 | 3.4043868 
3 26 0.47712125 | 1.41497335 | 0.67511386 | 0.22764469 | 2.0021496 
4 12 0.60205999 | 1.07918125 | 0.64973185 | 0.36247623 | 1.1646322 
5 í 0.69897 0.84509804 | 0.59069818 | 0.48855907 | 0.7141907 
6 4 0.77815125 | 0.60205999 | 0.46849374 | 0.60551937 | 0.3624762 
7 3 0.84509804 — 0.47712125 | 0.40321424 | 0.7141907 | 0.2276447 
8 2 0.90308999 0.30103 0.27185717 | 0.81557152 | 0.0906191 
9 1 0.95424251 0 0 0.91057877 0 
10 1 1 0 0 1 0 
55 526 | 6.55976303 | 9.16662191 | 3.61453889 | 5.21515941 | 14.736815 
Calculo de 


B= 


Y mz- 2 3.61453889 — 


(6.55976303)(9.16662191) 


10 


_ —2,398547862 _ 


Ew- 


OQ w 


10 


5.21515941— 


10 


(6.55976303y 


0.912110309 


= -2.629668624 = —b 


b=2.629668624 


A 2* Za) 310662191 ( 2 O 2.641662493 log 


loga =2.641662493 > a =102'2% = 438.1900311 
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La ecuación de Lotka estimada es: 


_ 438.19 


.2.62967 
Xx 


Coeficiente de correlación 
r =-—0.997887 


Coeficiente de determinación 
R? =(r)* (100%) = 99.58% 


Elite de autores que más producen artículos científicos. 


Elite = .'total de autores = 526 =22,93 =23 Autores publican 4 o más 
artículos 


Tabla 01 
x=N? a acumulados 
A y=N? autores 
artículos IP=log(x) autores 
1 400 0 526 
2 70 0.30103 126 
3 26 0.47712125 56 
4 12 0.60205999 30 
5 7 0.69897 18 
6 4 0.77815125 11 
7 3 0.84509804 7 
8 2 0.90308999 4 
9 1 0.95424251 2 
10 1 1 1 
Tabla 02 
Índice de productividad Autores % 

IP=0 400 76.05% 

O<IP<1 125 23.76% 

IP>=1 1 0.19% 

Total 526 100.00% 


La tabla 1, la última columna y la fila 5 se interpreta de la siguiente forma: 18 
autores publican 5 o más artículos. Para 23 autores, publican 4 o más artículos 


La tabla 02, indica la cantidad de autores más productivos y se obtienen a 
través del índice de productividad (IP), se calcula utilizando el logaritmo del 
número de artículos. 
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IP=0 baja productividad 
IP=log(x)=30<IP<1 media productividad 

IP>1 alta productividad 
Grafica 


autores 


125 


o A 


1P=0 O<IP<1 IP>=1 


3.4 Ley de Bradford (1934) 


La ley de Bradford relaciona revistas científicas con artículos publicados con el 
objetivo de determinar las revistas más productivas sobre un tema dado 


Enunciado 


Si un conjunto de revistas científicas se ordena asociadas a la productividad 
decreciente al número de artículos sobre un tema dado. Estas revistas se pueden 
agrupar en zonas que se forman dependiendo aproximadamente de la misma 
cantidad de artículos. Mientras que el conjunto de revistas utilizadas para cada 
zona aumenta en progresión geométrica 
ak" ak',ak?,ak?,....siendo a=menor N* de revistas k= multiplicador = razon 


Ejemplo aplicativo 
164 revistas científicas se ordenan en forman decreciente a la cantidad de 


artículos sobre un tema dado. (tomado del ejemplo de Bradford-Bibliografía de 
lubricación-1933) 
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N> N> total, N* ed cn 
revistas | artículos artículos Ñ FOtGE NM A w-y dado 
N? revistas | artículos 
1 1 22 22 1 22 0 0 0 
2 1 18 18 2 40 0.69314718 | 27.7258872 | 0.48045301 
3 1 15 15 3 55 | 1.09861229 | 60.4236759 | 1.20694896 
4 2 13 26 5 81 | 1.60943791 | 130.364471 | 2.59029039 
5 2 10 20 7 101 | 1.94591015 | 196.536925 | 3.78656631 
6 1 9 9 8 110|2.07944154| 228.73857| 4.32407713 
7 3 8 24 11 134 | 2.39789527 | 321.317967 | 5.74990174 
8 3 7 21 14 155 | 2.63905733 | 409.053886 | 6.96462359 
9 1 6 6 15 161| 2.7080502 | 435.996082 | 7.33353589 
10 7 5 35 22 196 | 3.09104245 | 605.844321 | 9.55454345 
11 2 4 8 24 204 | 3.17805383 | 648.322981 | 10.1000261 
12 13 3 39 37 243 | 3.61091791 |877.453053 | 13.0387282 
13 25 2 50 62 293 | 4.12713439 | 1209.25037 | 17.0332382 
14 102 1 102 164 395 | 5.09986643 | 2014.44724 | 26.0086376 
total 164 395 375 2190 | 34.2785669 |7165.47543 | 108.171571 
Pasos: 


1. Calculamos para la 3ra columna: total de artículos por revistas, luego el 


total general, que resulta 395 
2. Al total general de artículos 


E =98.75=99 articulos 


(395), 


lo dividimos en 4 zonas: 


Los grupos de revistas con aproximadamente 99 artículos, los ubicamos 
utilizando la 4ta y 5ta columna (acumulado revistas y acumulado total de 
artículos) los grupos de artículos acumulados para cada zona serán: 


101,196,293 y 395, cantidades que permite identificar las zonas: 

a. La primera zona tiene :101 artículos para 7 revistas 

b. La segunda zona tiene :196-101=95 artículos para 22-7=15 revistas 

C. La tercera zona tiene:293-196=97 artículos para 62-22=40 revistas 

d. La cuarta zona :395-293=102 artículos para 164-62=102 revistas 
Los resultados anteriores se presentan en el siguiente cuadro 


Zonas 


Total 


revistas 


Total artículos 


Zona-1 o núcleo: lugar donde se 
concentran las revistas más 
productivas en cuanto a la cantidad de 
artículos sobre un tema dado 


7 


101 


Zona-2 


15 


95 


Zona-3 


40 


97 


Zona-4 :lugar donde se concentran las 
revistas menos productivas 


102 


102 


Total 


164 


395 
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Multiplicador de Bradford= 


15 40 102 
k=2 E 40 -2.45 


7.45)”, 7(2.45)', 7.45), 7(2.45)' 
7 17, 42, 103 


Gráfica de acumuladas revistas (x) versus acumulados total de artículos (y) 


y=AC(Total Art) 


450 

400 e 
350 

300 . 
250 AA 


50 Ó 50 100 150 200 


X=AC(total revistas) 
Ecuación de Brookes 


y=bME) 
a 


Linealizado la ecuación de Brookes, desarrollando. 


y=bI(5)> y =b(nx Ina) =blnx-blna=(-bIna)+bln x 
a 


y=c+bw Modelo lineal linealizado, 


Dónde: 


Cc 


c=-blna »a=e P=exp(=3) 


w=ÍInx 


Sus ecuaciones para calcular b y c son: 
w 
a O YA y) 
y 
n 
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Con los totales de la tabla (de la 4ta hasta la 8va columna) 


b=74.3899394 
-25.7128939 


c=-25.7128939 > a = > 14309904? — 1.412908227 


Luego la ecuación es: 


y =74.3899394 In( ) 


x 
1.412908227 


Calculo del coeficiente de determinación 


R? = (coeficientedePearson)? =(0.97801145)? =0.9565 > 95.65% 


Buen ajuste del modelo matemático de Brookes. 


y=acum. total articulos 


+ 
y = 74,39In(x) - 25,713 


%  y=acum. total articulos 


—— Logarítmica (y=acum. 
total articulos) 


50 50 100 150 200 


Ejercicios 
Aplicación del modelo matemático de Bradford a la productividad de autores 


(datos tomados del informe profesional presentado por el Lic. Elías Reynaldo 
Barrenechea Gallardo) 
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Productividad de las revistas citadas en la 
Revista Anales de la Facultad de Medicina 


Revistas Artículos 
1 128 
90 
51 
39 
35 
30 
29 
28 


OlO|nloOolwlwlw0oIiniINN ajajajaja (aa jaa jajaja 
pe 
[e.) 


[00] 
pe 
[65] 


99 
266 
1116 


Fuente: datos tomados del informe profesional presentado por el licenciado 
Elías Reynaldo Barrenechea Gallardo (Revista Anales de la Facultad de 
Medicina de la UNMSM) 

a. Obtener las 4 zonas de Bradford 


b. Calcular el multiplicador de Bradford 


c. Estimar la ecuación de Brookes. 
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Ley de Zipf(1902-1950) 
Enunciado 


En todo documento que se formula en cualquier idioma, existen 
palabras cortas que ocurren con mayor frecuencia, en segundo lugar 
del ranking la palabra que se repite con mayor frecuencias es la mitad 
de la primera; para la tercera palabra que se repite es igual a la tercera 
parte de la primera, y así sucesivamente. 


Esto se presenta en la siguiente tabla en forma teórica. 


ar dad id X= Ranking de y : 
repiten en un repetición de las Y=Frecuencias de las 
documento o una palabras 
conversación palabres 
“de 1 400 
la 2 400(1/2)=200 
“en 3 400(1/3)=133 
“y 4 400(1/4)=100 
“para 5 400(1/5)=80 
él 6 400(1/6)=67 
“los 7 400(1/7)=57 
“las 8 400(1/8)=50 
“a 9 400(1/9)=44 
“por 10 400(1/10)=40 


Gráfica 


Y=Frecuencia de la palabra 


450 
400 4 
350 
300 
250 


Modelo matemático de Zipf 


roca. E 
X 


C= Valor constante 
X=Ranking de las palabras que se repiten con la mayor frecuencia 
Y=frecuencia de las palabras que se repiten. 


Para un documento cualquiera se registran los datos (X ; Y), para estimar el 
modelo de Zipf, se linealiza aplicando logaritmo decimal. . 


Y == pep > log y =log C + (log x) 
x 


Z=A+BW >modelo  linealizado 

Z =1lo0g y 

W =1l0g x 

A=logC>C=10* 

B=-1 

Para que se cumpla la ley de Zipf, el coeficiente de determinación( la bondad 
de ajuste) debe ser próximo al 100%, y el valor de B debe aproximar por la 
derecha o por la izquierda al valor -1. 


Ejemplo aplicativo. 


X=Ranking | Y=frecuencias  W=LOG(X) | Z=LOG(Y) WZ WW 

1 240 0 2.38021124 0 0 
2 120 0.30103 |2.07918125 0.62589592 | 0.09061906 
3 80 0.47712125 | 1.90308999 | 0.90800468 | 0.22764469 
4 60 0.60205999 |1.77815125 | 1.07055373 0.36247623 
5 48 0.69897 |1.68124124 1.17513719 0.48855907 
6 40 0.77815125 | 1.60205999 | 1.24664499 |0.60551937 
7 34 0.84509804 | 1.53147892 |1.29424983 | 0.7141907 
8 30 0.90308999 | 1.47712125 |1.33397341 0.81557152 
9 27 0.95424251 | 1.43136376 | 1.36586815 |0.91057877 

10 24 1 1.38021124 1.38021124 1 
11 22 1.04139269 1.34242268 1.39798916 | 1.08449872 
12 20 1.07918125  1.30103 —1.40404717 |1.16463216 
13 18 1.11394335 1.25527251 1.39830246 | 1.24086979 
14 17 1.14612804 1.23044892 1.41025201 | 1.31360947 
15 16 1.17609126 1.20411998 1.41615499 | 1.38319065 
16 15 1.20411998 1.17609126 1.41615499 | 1.44990493 
17 14 1.23044892 1.14612804 1.41025201 | 1.51400455 
18 13 1.25527251 1.11394335 1.39830246 | 1.57570906 
19 13 1.2787536 |1.11394335 1.42445907 | 1.63521077 
20 12 1.30103 |1.07918125 | 1.40404717 | 1.69267905 
18.3861246 29.2066915 24.4805006 | 19.2694686 
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(18.3861246)(29.3861246) 


(24.4805006 
B= a Tr , =-1.00101528 
19000 PPP AO 
20 
A= A 100101528, =2.38057416 > C =10?%%%%" — 240.2000638 
R? =99.98% 


Por las estadísticas calculadas los datos de la tabla, cumple con la ley de Zipf. 
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Capítulo 4 


4.1. Indicadores bibliométricos 


Son medidas que proporcionan información sobre los resultados de la 
producción científica. Existe herramientas bibliometricas tales como: Web 
Science, Scopus, Google académico y Dimensions, que proporcional tales 
indicadores. 


Los indicadores bibliométricos más importantes son: 
4.2. El número de citas recibidas por los artículos publicados en una revista 


Su valor indica el número de veces que una revista o artículo publicado ha 
sido reconocido por otro autor. Su valor se obtiene haciendo un recuento de 
cuantas veces un artículo o revista fue citado en un trabajo de investigación y 
está publicado. 


Ejemplo-1: 


Un biólogo durante los años 2015 al 2022, ha publicado 5 artículos, el cuadro 
muestra la cantidad de citas que ha recibido por parte de otros profesionales. 


Artículos cantidad de 
publicados citas 
(trabajos de di 

E O recibidas 
investigación) 

A 2 

B 6 

C 5 

D 10 

E 1 


Gráfica: cantidad de citas recibidas por sus trabajos publicados durante los 
años 2015 al 2022 


cantidad de citas recibidas 
10 
5 6 
6 5 
4 2 
2 
(0) 
A B Cc D E 


74 


El número de citas: 


Mide cómo influye o cómo impacta un trabajo científico en la comunidad 
científica (consumidor). 


El número de citas es un reconocimiento del trabajo realizado por un científico. 


El número de citas se para determinar otros indicadores, tales como el factor 
de impacto (Fl), índice h, índice ¡10, etc. 


Aporte del número de citas 


Indica la repercusión de una investigación en la comunidad científica. 
Mide el interés y la influencia, aunque no siempre sea positiva. 
Limitaciones 

No debe utilizarse como un indicador de calidad 


No debe usarse como una medida de reputación positiva para los 
investigadores individuales. 


4.3. Elíndice H de un investigador. 


El índice h o también llamado índice de Hirsch fue propuesto en el año 2005 
por Jorge E Hirsch, físico de la universidad de California en San Diego. 


Es un indicador numérico que evalúa la producción científica de un 
investigador, utilizando la cantidad de publicaciones con el número de citas 
recibidas. 


Cálculo del índice h 


a. En una tabla de frecuencias se colocan todas las publicaciones de un 
autor, con su correspondiente número de citas recibidas por sus trabajos. 


b. Las publicaciones se ordenan tomando como referencia a las citas de 
mayor a menor (orden decreciente de las citas recibidas). 


Cc. Alas publicaciones del punto anterior, se enumera de menor a mayor, 
empezando por el número uno. 


d. Se compara al número de citas con la numeración dada en el punto 
anterior, comparación que debe ser mayor o igual. 


e. Cuando se encuentra una publicación cuyo número de citas sea inferior al 
número de orden; el índice h para el autor será el orden inmediatamente 
anterior. 
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Del ejemplo-1, calcular el índice h para el investigador e interpretarlo. 


Artículos Cantidad de 
publicados ol 
fecha recibidas a 
la fecha 

A 2 

B 6 

Cc 5 

D 10 

E 1 


Para su cálculo del índice h, de un autor, se ordenan sus artículos publicados 
por el autor, tomando en cuenta a la cantidad de citas recibida en forma 
decreciente. La cantidad de citas recibida debe ser mayor o igual al nuevo orden 
de los artículos, el primero de los artículos publicado que no cumple la condición, 
entonces el anterior orden de los artículos publicados es el índice h para el autor. 


Artículos publicados ordenados | cantidad de 
tomando en cuenta a la citas criterio 
cantidad de citas recibidas recibidas 
10>1er 
D(1) 10 orden(Verdad) 
6> 2do 
B(2) 6 orden(Verdad) 
5>3er 
C(3) 5 orden(Verdad) 
2>=4to 
A(4) 2 orden(Falso) 
1>=4to 
E(5) 1 orden(Falso) 


El índice h para el autor o investigador es igual a 3, significa que tres trabajos 
científicos publicados por el investigador (Artículos: D, B, C) han recibido 3 o más 
citas 


Ventajas 


Combina en un único indicador una medida de cantidad y otra de impacto de la 
producción científica. 


Detecta los investigadores más destacados de un área de conocimiento. 
Favorece las carreras científicas más dilatadas, investigadores genios. 
Limitaciones 


No es adecuado para comparar investigadores de diferentes áreas (biólogos 
publican más que los matemáticos) 


Perjudica a los investigadores con actividad científica reciente. 
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Depende del número total de publicaciones. El índice h nunca podrá ser superior 
al número total de documentos. 


Penaliza a los autores que publican menos, pero publican mejor 
Notas: 


Las bibliotecas universitarias, de hospitales y centro de investigación cuentan 
con profesionales que ayudan a: 


Conocer las citas recibidas por su investigación. 
Calcular el índice h. 
Crear perfiles “profesionales” con indicador bibliométrico. 


Asesorar sobre evaluación de la investigación, revistas en los que publican, 
artículos muy citados, comparativos, etc. 


4.4. El índice i10 de un investigador. 
Su valor que indica el número de trabajos científicos que un autor ha escrito y a 


la fecha recibió 10 a más citas. La base de datos que proporcionan este índice 
es Google Scholar. 


Ejemplo 
La tabla presenta 4 trabajos publicados por un investigador y las citas 
recibidas. 
N? de trabajos científicos | N* de citas recibidas por 
publicados a la fecha los trabajos publicados a 
la fecha. 

A 3 

B 9 

c 12 

D 10 


De la tabla el índice ¡10 para el autor es 2 (trabajos: C y D), existen 2 trabajos 
que recibieron 10 a más citas 


4.5. Factor de impacto de una revista científica (Fl) 


El factor de impacto de una revista se utiliza para comparar la importancia de 
dicha revistas con otras, en el mismo campo científico. El factor de impacto de 
una revista en un año determinado, se calcula como el cociente del total de 
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citas recibidas por las publicaciones en los dos años anteriores y el total de 
trabajo publicados en esos dos años. El resultado del cociente se interpreta 
como el promedio anual de citas de artículos por una revista: 


FI, = factor de 
Ñ Citas 


impacto por 


recibidas por la 


la revista en el 


revistas en los 


año Xx 


años(x—2,x—1) 


* Total de ariculos 


Ejemplo 


publicados 


por la revista 


en los años(x-2,x—1) 


Calcular el factor de impacto de una determinada revista científica para el 


año 2020. 
Total de artículos Total de citas 
des anteñoras publicados por la recibidas en el 2020 
al año 2020 revista en los años por los artículos 
2018 y 2019 publicados en los 
años 2018 y 2019 
2018 20 500 
2019 50 800 
Fl... = Citas recibidas por la revistas en los años(2018,2019) 
22 Total de ariculos publicados por la revista en los años(2018,2019) 
PA 
22 20+50 70 


Interpretación: 


En promedio en el año 2020, la revista científica recibió 18.57 citas, por cada 
artículo publicado. 


4.6. Índice de inmediatez de una revista (li) 


Es un valor que nos muestra que tan rápido es citada una revista científica. Se 
calcula dividiendo el total de citas recibida por un artículo publicado en un año 
determinado y el total de artículos que público la revista en ese año. 


li Total de citas que reciben en un año los articulos publicados 
ES 

Total de articulos publicados por esa revista en ese año 
Ejemplo 


La revista científica ABC, tienen los siguiente datos con respecto al número de 
artículos que publico y al número de citas que ha recibido desde que fue 
publicada para el mismo año. Calcular el índice de inmediatez para cada año. 


años artículos publicados | citas recibidas | Índice de Inmediatez li 
2000 150 80 0.53 
2001 100 200 2.00 
2002 120 120 1.00 
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112000) = e =0.53 citas / articulos 


1i(2001) = 100 =2.0 citas / articulos 


1i(2002) = = =1.0 citas / articulos 


Interpretación 


Para el año 2000, el valor 0.53, indica que por cada 2 artículos publicados en 
las revistas ABC, se recibió 1 cita. 


Para el año 2001, el valor 2, indica que por cada artículo publicado en la revista 
ABC, se recibió 2 cita. 


Para el año 2002, por cada artículo publicado en la revista ABC, se recibió una 
cita. 


4.7. Vida media de un trabajo de investigación (Vm) 


La vida media de un documento publicado sobre un tema dado, se refiere al 
tiempo durante el cual fue publicada la mitad de la literatura activa o circulante. 
Para calcular la vida media toma en cuenta el tiempo de circulación de un 
documento y las citas recibidas. Se utiliza la fórmula: 


05-a 


b-a 


Vm=k=+ 


k=número de años que toma acumular el 50% de las citas recibidas. 
a=Proporción del número de citas acumuladas antes del 50% de citas 
recibidas. 

b= Proporción del número de citas acumuladas después del 50% de citas 
recibidas. 


Ejemplo 


Calcular la vida media de un artículo publicado sobre matemática, entre los 
años 2000 al 2020. 


Años Citas Acumuladas citas recibidas 
recibidas en forma decreciente 
2000 0 302 
2001 2 302 
2002 8 300 
2003 12 292 
2004 26 280 
2005 42 254 
2006 30 212 
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Citas Acumuladas citas recibidas 

Años recibidas en forma decreciente 
2009 15 56 

2010 10 41 

2011 7 31 

2012 5 24 

2013 4 19 

2014 4 15 

2015 3 11 

2016 2 8 

2017 2 6 

2018 2 4 

2019 1 2 

2020 1 1 

Total 302 


El artículo desde que se publicó 2000 al 2020 recibió un total de 302 citas, el 
50% es 302/2=151, en la tabla este valor se busca en las frecuencias 
acumuladas de citas, encontrándose entre 126 menor número de citas y 182 
mayor número de citas. El valor entero ( k ) es igual al número de años 
transcurrido desde el menor número de citas hasta el último año de estudio ( 
2008 hasta 2020) el valor de k=13 años. El valor de a es igual al menor número 
de citas recibidas antes de 50%, dividido por el total de citas recibidas (302) y 
b es igual al mayor número de citas recibidas después del 50%, dividido por 
el total de citas (302), es decir, 


126 182 
a= = 


29 041721854 y b===0.60264901 
302 302 
A O E 
h=a (182/302 -126/302) 


Interpretación: 13.45 años, es la vida media del artículo publicado en el 
periodo de 2000 a 2020. 


4.8.  —Cuartil 


Es una medida de posición de una revista científica en comparación con todas 
las revistas las de sus áreas. Se obtiene al ordenar a las revistas de mayor a 
menor factor de impacto, al total de revistas ordenadas la dividimos en 4 
partes iguales, cada una de estas partes será un cuartil. Las revistas con el 
factor de impacto más alto pertenecen al primer cuartil, los cuartiles medios 
serán el segundo y tercer cuartil y las revistas de bajo impacto pertenecen al 
cuarto cuartil. 
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4.9. Índice de colaboración (IC) 


La colaboración científica se define como un proceso social de investigadores 
que se juntan con el propósito de realizar un nuevo trabajo de investigación, 
compartiendo sus recursos intelectuales y materiales. Se calcula, dividiendo 
el total de firmas (autores) por número de trabajos publicados en un período 
de estudio; para una tabla de frecuencias se tiene: 


k 
Pene 
IC=“=L_ 
n 


x, =Es el número de autores de un documento publicado. 
f,=Es la cantidad de documentos publicados para el i-ésimo número de 


autores 
n =Es el total de documentos publicados en el período de estudio. 


Se interpreta como el promedio de colaboradores en la formulación de 
documentos en el período en estudio. 


La colaboración puede ser local, nacional e internacional 


Para medir y mostrar las relaciones que se establecen entre los productores 
en la investigación puede aplicarse el análisis de las redes sociales científicas. 
Los indicadores de las redes nos permiten analizar el grado de conectividad 
de la red, número de interacciones de actores, así como el acercamiento entre 
éstos a través de sus interacciones. De estos indicadores se desprende que 
autores son más influyentes para establecer trabajos en colaboración. 


4.10. El grado de colaboración (GC) 


Su valor se interpreta como el aporte de cada grupo de autores, se calcula a 
través de la formula 


GC, =X; ¿L) 
n 


4.11. Coeficiente de colaboración (CC) 


NO 


co=o 2% 
n 


Ejemplo aplicativo 


Ejemplo durante los años 2010 al 2015, una Universidad publico 18 trabajos 
científicos, tal como se detalla en la siguiente tabla. Calcular el índice de 
colaboración, el grado de colaboración y coeficiente de colaboración de 
autores. 
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Tabla: Cantidad de autores y cantidad de trabajos publicados 
durante 2010-2015. 


y = NP f, =número aa 
de Xx, GC Xx; 
autores(colaboradores) dumentas : 
1 1 1 0.06 1.00 
2 4 8 0.44 2.00 
3 6 18 1.00 2.00 
4 5 20 1.11 1.25 
5 2 10 0.56 0.40 
Total 18 57 3.17 6.65 


Para el índice de colaboración IC: 


LAA 
= 5) =3.17 autores 
n 18 


Durante los años 2010 al 2015 el promedio de colaboradores para los 18 
documentos formulados es de 3.17 autores. 


Calculo del grado de colaboración 


1, 
GC =1.(2)=0.06 6.0% 


6.0%, es el grado de participación para 1 autor 


4 
GC =2.( 2) =0.44 > 44.0% 


44.0%, es el grado de participación para 2 autores 


GC = 15 =1.0 > 100.0% 


100.0%, es el grado de participación para 3 autores 


GC 4) =1.1115111.1% 


111.1%, es el grado de participación para 4 autores 


GC = 0 =0.556 > 55.6% 


55.6%, es el grado de participación para 5 autores 


Calculo del coeficiente de colaboración 


dl 
es 
n 18 


CC =1 =0.631 
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Anexos-1 
1. Demostrar que: log, M.N =10g, M +log, N 


Sean dos números: 


M>0,N>0 an bxl1>0> 

log, M=x=>b* =M 

log, N=y>b* =N 

b** =M.N > log, M.N =x+ y >l0g, M.N =1l0g, M +1log, N demostrado 


2. Demostrar que: log, log, N=x>N=a” 


log, log, N=x>b*=lo0g, N>N=a” demostrado 
3. Gráfica de un modelo no lineal linealizado 


y=ab* modelo no lineal 
log y =loga+(logb)x z=A+Bx<modelo no lineal linealizado 
Modelo No lineal Modelo linealizado 


y 


150 


100 


0 ey 


50 + 


1 + + 4 z=logy 


4. Estimación de los parámetros fP, y  f,, por mínimo cuadrados ordinarios 
(MCO) 


Sea el modelo de regresion lineal 


Y, =B,+P,x, + €, 
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Para estimar los parámetros f£, y $, ,se extrae una muestra aleatoria de 
tamaño n y setoman las medidas (x,;y,) ¡=12,3,...,n 
Sea el modelo estimado y, =b,+b,x, +e;- Siendo 


b, estima f,; b, estima f, y e, estima e,, el método por mínimo 


cuadrados ordinarios (MCO) consiste en minimizar la suma de cuadrados de los 
residuos: 


Ne =N0,-b, bx, =/(b,,b,) 
Al i=l 


Of (b,b, = 
e 1) =0>50b, =y-b,x 
bb) Ñ Y, 0, -)) 


AA 
Y (x, 1) 
i=l 


5. Coeficiente de determinación R? 


Y, =by +b,x, +e, > Y, =y-b,x+b,x, +6, Y, y =b(x, 1) +e, 


Yo, -yy ao —x) +Ye dividiendo por Yo, -yy 
i=l i=l dal 


2” 


Y (a, =x) e PES Ne 


1= ¡al i=l + i=l 


Foot oy o 


2 1 pe 
NY O, -y* YN O, -y»Y 
i=l 
y e, =0>R*=l>un buen ajuste del modelo estimado 
i=l 


6. Demostrar que R? =]|r]' 


¿Na Ya-d-» Ya -y 
Como R?= 2 =(2 y )= 


Yo, y Na y Lo 


Cada Ea a, 
R? = i=l Ñ i=l )= i=l ) 


Ca-  YNo,-» Ya 1? Yo, -y 


Ñ el 
a 


do, NN a 00, 


p?= 2 - - =[-P demostrado 
Ya 0 E “E o» 
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Anexo-2 

Las siguientes tablas estadísticas han sido obtenidas por el autor, mediante el 
paquete estadístico MINITAB Y MICROSOFT EXCEL 

1. NORMAL ESTANDAR 


2.  T-STUDENTS 
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PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION NORMAL ESTANDAR 
(PARA VALORES POSITIVOS DE 2) 


z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 
0,00| 0,5000 0,5040 0,5080 | 055120  0,5160| 0,5199 0,5239 0,5279| 0,5319 0,5359 
0,10| 0,5398 0,5438  0,5478| 0,5517  0,5557| 0,5596 0,5636  0,5675| 0,5714 0,5753 
0,20 | 0,5793 0,5832 0,5871| 0,5910  0,5948| 0,5987 0,6026 0,6064| 0,6103 0,6141 
0,30 | 0,6179 0,6217  0,6255| 0,6293  0,6331| 0,6368 0,6406  0,6443| 0,6480 0,6517 
0,40 | 0,6554 0,6591  0,6628| 0,6664 0,6700| 0,6736 0,6772  0,6808| 0,6844 0,6879 
0,50| 0,6915 0,6950  0,6985| 0,7019 0,7054| 0,7088 0,7123  0,7157| 0,7190 0,7224 
0,60 | 0,7257 0,7291  0,7324| 0,7357  0,7389| 0,7422 0,7454  0,7486| 0,7517 0,7549 
0,70| 0,7580 0,7611 0,7642| 0,7673  0,7704| 0,7734 0,7764  0,7794| 0,7823 0,7852 
0,80 | 0,7881 0,7910  0,7939| 0,7967  0,7995| 0,8023 0,8051  0,8079| 0,8106 0,8133 
0,90 | 0,8159 0,8186  0,8212| 0,8238  0,8264| 0,8289 0,8315  0,8340| 0,8365 0,8389 
1,00 0,8413| 0,8438 0,8461 0,8485 0,8508  0,8531| 0,8554 0,8577  0,8599| 0,8621 
1,110 0,8643| 0,8665 0,8686 0,8708 0,8729 0,8749| 0,8770 0,8790  0,8810| 0,8830 
1,20  0,8849| 0,8869 0,8888 0,8907 0,8925 0,8944| 0,8962 0,8980  0,8997| 0,9015 
1,330 0,9032| 0,9049 0,9066 0,9082 0,9099 0,9115| 0,9131 0,9147  0,9162| 0,9177 
1,140  0,9192| 0,9207 0,9222 0,9236 0,9251  0,9265| 0,9279 0,9292  0,9306| 0,9319 
1,550  0,9332| 0,9345 0,9357 0,9370 0,9382  0,9394| 0,9406 0,9418  0,9429| 0,9441 
1,60 0,9452| 0,9463 0,9474 0,9484 0,9495 0,9505| 0,9515 0,9525  0,9535| 0,9545 
1,170 0,9554| 0,9564 0,9573 0,9582 0,9591  0,9599| 0,9608 0,9616  0,9625| 0,9633 
1,180. 0,9641| 0,9649 0,9656 0,9664 0,9671  0,9678| 0,9686 0,9693 0,9699| 0,9706 
1190 0,9713| 0,9719 0,9726 0,9732 0,9738  0,9744| 0,9750 0,9756  0,9761| 0,9767 
2,00 0,9773  0,9778| 0,9783 0,9788| 0,9793 0,9798  0,9803| 0,9808 0,9812 0,9817 
2,110 0,9821  0,9826| 0,9830 0,9834| 0,9838 0,9842 0,9846| 0,9850 0,9854 0,9857 
2,20 0,9861  0,9864| 0,9868 0,9871| 0,9875 0,9878  0,9881| 0,9884 0,9887 0,9890 
2,30 0,9893 0,9896| 0,9898 0,9901| 0,9904 0,9906  0,9909| 0,9911 0,9913 0,9916 
2,40 0,9918 0,9920| 0,9922 0,9925| 0,9927 0,9929 0,9931| 0,9932 0,9934 0,9936 
2,50 0,9938 0,9940 | 0,9941  0,9943| 0,9945 0,9946  0,9948| 0,9949 0,9951 0,9952 
2,60 0,9953 0,9955| 0,9956 0,9957| 0,9959 0,9960  0,9961| 0,9962 0,9963 0,9964 
2,70 0,9965 0,9966| 0,9967 0,9968| 0,9969 0,9970 0,9971| 0,9972 0,9973 0,9974 
2,80 0,9974  0,9975| 0,9976 0,9977| 0,9977 0,9978  0,9979| 0,9979 0,9980 0,9981 
2,90 0,9981  0,9982| 0,9983 0,9983| 0,9984 0,9984  0,9985| 0,9985 0,9986 0,9986 
3,00 | 0,9987 0,9987 | 0,9987 | 0,9988  0,9988| 0,9989 0,9989 0,9989| 0,9990 0,9990 
3,10| 0,9990 0,9991 0,9991 | 0,9991  0,9992| 0,9992 0,9992  0,9992| 0,9993 0,9993 
3,20| 0,9993 0,9993 0,9994| 0,9994  0,9994| 0,9994 0,9994  0,9995| 0,9995 0,9995 
3,30| 0,9995 0,9995 0,9996| 0,9996 0,9996| 0,9996 0,9996 0,9996| 0,9996 0,9997 
3,40 | 0,9997 0,9997 0,9997 | 0,9997  0,9997| 0,9997 0,9997  0,9997| 0,9997 0,9998 
3,50| 0,9998 0,9998  0,9998| 0,9998  0,9998| 0,9998 0,9998  0,9998| 0,9998 0,9998 
3,60 | 0,9998 0,9998  0,9999| 0,9999  0,9999| 0,9999 0,9999  0,9999| 0,9999 0,9999 
3,70 | 0,9999 0,9999  0,9999| 0,9999 0,9999| 0,9999 0,9999  0,9999| 0,9999 0,9999 
3,80 | 0,9999 0,9999 0,9999| 0,9999  0,9999| 0,9999 0,9999  0,9999| 0,9999 1,0000 
3,90 | 1,0000 1,0000  1,0000| 1,0000  1,0000| 1,0000 1,0000  1,0000| 1,0000 1,0000 
4,00, 1,0000, 1,0000| 1,0000 | 1,0000| 1,0000, 1,0000, 1,0000| 1,0000, 1,0000, 1,0000 


Profesor: Fausto Matos Uribe de la Universidad Nacional Mayor de San Marcos 
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PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION NORMAL ESTANDAR 
(PARA VALORES NEGATIVOS DE Z) 


-0,0900 | -0,0800 | -0,0700 | -0,0600 | -0,0500  -0,0400 -0,0300 -0,0200|-0,0100| 0,0000| Z 


0,0000 | 0,0000 | 0,0000 | 0,0000 | 0,0000 0,0000 0,0000 0,0000| 0,0000| 0,0000| -4,0 


0,0000 | 0,0000 | 0,0000 | 0,0000 | 0,0000 | 0,0000 0,0000 | 0,0000| 0,0000| 0,0000| -3,9 


0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001| 0,0001| 0,0001| -3,8 


0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001| -3,7 


0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001 | 0,0001| 0,0002| 0,0002| -3,6 


0,0002| 0,0002 | 0,0002 | 0,0002| 0,0002 | 0,0002 | 0,0002 | 0,0002| 0,0002| 0,0002| -3,5 


0,0002| 0,0003 | 0,0003 | 0,0003 | 0,0003 | 0,0003 | 0,0003 | 0,0003| 0,0003| 0,0003| -3,4 


0,0003| 0,0004 | 0,0004 | 0,0004 | 0,0004 | 0,0004 | 0,0004 | 0,0005| 0,0005| 0,0005| -3,3 


0,0005| 0,0005| 0,0005| 0,0006 0,0006 0,0006 0,0006 0,0006| 0,0007| 0,0007| -3,2 


0,0007 | 0,0007 | 0,0008 | 0,0008 | 0,0008 | 0,0008 | 0,0009 | 0,0009| 0,0009| 0,0010| -3,1 


0,0010| 0,0010 | 0,0011 | 0,0011 | 0,0011 | 0,0012 0,0012  0,0013| 0,0013| 0,0014| -3,0 


0,0014 | 0,0014 | 0,0015 | 0,0015 | 0,0016 | 0,0016 | 0,0017 | 0,0018| 0,0018| 0,0019| -2,9 


0,0019 | 0,0020 | 0,0021 | 0,0021 | 0,0022 | 0,0023 | 0,0023 | 0,0024| 0,0025| 0,0026| -2,8 


0,0026| 0,0027 | 0,0028 | 0,0029 | 0,0030 | 0,0031 | 0,0032 | 0,0033| 0,0034| 0,0035| -2,7 


0,0036| 0,0037 | 0,0038 | 0,0039 | 0,0040 | 0,0041 | 0,0043 | 0,0044| 0,0045| 0,0047| -2,6 


0,0048 | 0,0049 | 0,0051 | 0,0052 | 0,0054 | 0,0055 | 0,0057 | 0,0059| 0,0060| 0,0062| -2,5 


0,0064| 0,0066 | 0,0068 | 0,0069 | 0,0071 | 0,0073 | 0,0075 | 0,0078| 0,0080| 0,0082| -2,4 


0,0084 | 0,0087 | 0,0089 | 0,0091 | 0,0094 | 0,0096 | 0,0099 | 0,0102| 0,0104| 0,0107| -2,3 


0,0110| 0,0113| 0,0116 | 0,0119 0,0122 0,0125 0,0129 0,0132| 0,0136| 0,0139| -2,2 


0,0143| 0,0146 | 0,0150 | 0,0154 | 0,0158 | 0,0162 | 0,0166 0,0170| 0,0174| 0,0179| -2,1 


0,0183| 0,0188 | 0,0192| 0,0197 | 0,0202 0,0207 0,0212 0,0217| 0,0222| 0,0228| -2,0 


0,0233| 0,0239 | 0,0244 | 0,0250 | 0,0256 | 0,0262 | 0,0268 | 0,0274| 0,0281| 0,0287| -1,9 


0,0294 | 0,0301 | 0,0307 | 0,0314 | 0,0322 | 0,0329 0,0336 | 0,0344| 0,0351| 0,0359| -1,8 


0,0367 | 0,0375 | 0,0384 | 0,0392 | 0,0401 | 0,0409 | 0,0418 | 0,0427| 0,0436| 0,0446| -1,7 


0,0455 | 0,0465 | 0,0475 | 0,0485 | 0,0495 | 0,0505 | 0,0516 | 0,0526| 0,0537| 0,0548 | -1,6 


0,0559 | 0,0571 | 0,0582 | 0,0594 | 0,0606 | 0,0618 | 0,0630 | 0,0643| 0,0655| 0,0668 | -1,5 


0,0681| 0,0694 | 0,0708 | 0,0721 | 0,0735 | 0,0749 0,0764 | 0,0778| 0,0793| 0,0808 | -1,4 


0,0823| 0,0838 | 0,0853 | 0,0869 | 0,0885 | 0,0901 | 0,0918 | 0,0934| 0,0951| 0,0968 | -1,3 


0,0985| 0,1003 | 0,1020 | 0,1038 | 0,1057 0,1075 0,1093 0,1112| 0,1131| 0,1151| -1,2 


0,1170| 0,1190 | 0,1210 | 0,1230 | 0,1251 | 0,1271 | 0,1292 | 0,1314 | 0,1335| 0,1357| -1,1 


0,1379| 0,1401 | 0,1423 | 0,1446 | 0,1469 0,1492 0,1515  0,1539| 0,1562| 0,1587| -1,0 


0,1611| 0,1635 | 0,1660 | 0,1685 | 0,1711 | 0,1736 | 0,1762 | 0,1788| 0,1814| 0,1841| -0,9 


0,1867 | 0,1894 | 0,1922 | 0,1949 | 0,1977 | 0,2005 | 0,2033 | 0,2061| 0,2090| 0,2119| -0,8 


0,2148 | 0,2177 | 0,2207 | 0,2236 | 0,2266 | 0,2297 0,2327 | 0,2358| 0,2389| 0,2420| -0,7 


0,2451| 0,2483 | 0,2514 | 0,2546 | 0,2578 | 0,2611 | 0,2643 | 0,2676| 0,2709| 0,2743| -0,6 


0,2776| 0,2810 | 0,2843 | 0,2877 | 0,2912 | 0,2946 0,2981 | 0,3015| 0,3050| 0,3085| -0,5 


0,3121| 0,3156 | 0,3192 | 0,3228 | 0,3264 | 0,3300 | 0,3336 | 0,3372| 0,3409| 0,3446| -0,4 


0,3483 | 0,3520 | 0,3557 | 0,3594 | 0,3632 | 0,3669 0,3707 | 0,3745| 0,3783| 0,3821| -0,3 


0,3859 | 0,3897 | 0,3936 | 0,3974 | 0,4013 0,4052 0,4090  0,4129| 0,4168| 0,4207| -0,2 


0,4247 | 0,4286 | 0,4325 | 0,4364 | 0,4404 | 0,4443 | 0,4483 | 0,4522| 0,4562| 0,4602| -0,1 


0,4641 | 0,4681 | 0,4721 | 0,4761| 0,4801 | 0,4840 0,4880 | 0,4920| 0,4960| 0,5000| 0,0 


Profesor: Fausto Francisco Matos Uribe 
Universidad Nacional Mayor de San Marcos. 
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